上記の続きのpart2。
私的ハイライト
ナレッジベースについて
llm になるべく想定通りの仕事をしてもらうためには考える範囲を絞り、特定の目的に合わせた振る舞いを教え込まねばならない
言葉で検索できるように画像の OCR だったり、メタデータを付与して整理することが必要。メタデータと言葉による検索の2つに備えて、ファイルを常に分析検索可能にするためのライフサイクルを支える仕組みが欠かせない
構造化データにおいて、ビッグデータの活用のために生み出されてきた。設計が有効である。データレイクデータウェアハウスデータマートデータカタログ
ワークフローとナレッジベースを両輪として回すことが llm の行理業務運用の鍵となる
転記抽出の実現方法書類の読み方、抽出の仕方を教えるためのワークフローと過去の抽出例を保存したナレッジベースの2つが必要になる書類のどの部分に注目しているのかを明確にする。どのようなルールや基準でどの情報を抜き出しているのかを整理する。抽出した内容が正しいかどうかをどのような方法で検証しているのか?例えば、過去の抽出例や他の項目との整合性チェックなど、最後に抽出結果をどのようなフォーマットでまとめる必要があるのか?
書類を書く、長年の経験や組織文化に根ざした暗黙のルールも数多く存在するものである。どのような視点で人が読むのかを整理しておく
書類をレビューする。正確性ルールへの合致承認。コンテキストを理解することが極めて、重要プロセスを丁寧に分解すること。パターンに分類分解する
AI エージェントとは自立性と目的思向性を持っている。何を達成して欲しいのかという明確な目標とその達成のために利用可能なリソース
業務の完全自動運転。これにも5段階のレベルがある。どのレベル感でやるべきなのか
poc 貧乏にならないようにpoc を繰り返すものの、それが具体的な事。業価値や全社的な改革につながらず、結果として時間とコストだけを漏出してしまう。ケースを避けるより、長期的かつ戦略的な視点を持つことで回避させる
比較的単純な提携業務や明確な成果が見込める。領域から着手するのが件名。自動化された業務の周辺に類似業務やその前後の業務があるはず
