Gemini API File Search、マルチモーダル RAG とページ単位の引用

277文字
1分
編集

Gemini API の File Search に、マルチモーダル対応・カスタムメタデータ・ページ単位の引用の 3 点が追加された。非構造化データを整理し、検証可能な RAG を組み立てる開発者向けの更新であり、プロトタイプから大規模利用まで、テキストと視覚データを同一パイプラインで扱える。

  • 画像とテキストをネイティブに処理する。Gemini Embedding 2 が視覚データを理解し、キーワードやファイル名に頼らず、自然言語のブリーフで感情的トーンや視覚スタイルに合うアセットをアーカイブ全体から検索できる。
  • カスタムメタデータで、department: Legalstatus: Final のようなキーと値のラベルを非構造化データに付与できる。クエリ時にメタデータフィルタを適用し、無関係な文書のノイズを減らして取得の速度と精度を上げる。
  • ページ引用では、大規模 PDF から引いた回答について、インデックス済みの各断片にページ番号を紐づける。応答を元ソースの該当ページへ直接示し、ファクトチェックと信頼性の向上を狙う。

#参考文献