姫路IT系勉強会 2023.09

最近のニュース

お題

ここの下にお題(相談したいこと、発表したいことなどなんでも)お書きください。
※ 記載するお題は参加者一人につき1つだけ記載するようにお願いします。
### <ネタ>+(名前)の形式でお題を記載してください。

プロジェクト管理はみんなどうしてますか(ぎっぽれ)

GPTを使用してOCRをしてみたらいい感じでした(守屋)

  • Gihyoの記事を参考にReact+nodejsで、GoogleVisionAPIで文字認識+OpenAIでOCRを作ってみました
  • Function Callingを使うと、GPTの処理結果を任意のオブジェクト形式で受け取る事ができる
    • プログラムの一部としてGPTを明確に埋め込みやすくなる
    • 戻りデータ形式を任意で固定化出来るので、標準APIのように仕様に左右されない
    • 複数の処理をまとめた内容も定義できるので、APIの呼び出しよりコストが下がる
  • 本来なら検出された文字の座標情報を、項目に当てはめる処理が出る
  • 検出された文字列が何に該当するかをGPTが判断する
    • 請求書、領収書、納品書、名刺、ハガキ、など書類の種類もGPTが判定
    • オブジェクトに当てはめる方法等、日本語で定義できる
    • 自然言語の定義ファイルで、対応可能な書類の数を増やせる
    • 曖昧な情報、状況でもGPTがいい感じに判断し、情報を得ることが出来る
  • 無い情報の対応を明示してないと、嘘情報が埋まった物が返る

(小ネタ)都道府県スロット的なものを(守屋)

告知

イベント名(開催日時)

(イベントの概要をここに書く)