やりたいこと
データを読み込むだけで、以下が自動で行われる仕組みを構築したい。
- 読み込んだデータがElasticsearchに自動登録される
- データと指示内容がGeminiに渡され、PlaybookやTool/Schemaが自動生成される
- 生成された内容が自動でPlaybookやToolに反映され、管理用エージェントと紐づいて構成される
前回の調査日記
あわせて読みたい


AI Agent開発日記 2025/07/18
やりたいこと データを読み込むだけで、以下が自動で行われる仕組みを構築したい。 読み込んだデータがElasticsearchに自動登録される データと指示内容がGeminiに渡さ...
目次
コードに問題がないか全体を通して検証する。
- やりたいこと
- 現状のコードに問題がないか全体を通して検証をしたい。
- 現状
- 自動生成中に「(試行 1/3)」の処理が3回を超えても終了しない問題があったため、修正を行った。
- 自動生成で作成したtoolとplaybookを使ったElasticsearch検索でリクエストに失敗した。原因は必要な権限を設定していないことかと思ったが、権限を与えてもエラーが続いた。サーバーが明記されていなかったことが原因だったため、自動生成プロンプトを修正中。
agentbuilder datastore設定の調査
- Dialogflow CX が使えなくなっていたり、Toolを使う上でUIや構造がかなり変わっていた。
- 動作しない大きいファイルと、動作する小さいファイルの検証
- 用意して検証を行ったが、両方とも検索に失敗した。
- 動物リスト(800KB)とアダム・スミスの論理学(1MB)をデータストアに入れて検証
- 論理学はまったく検索がヒットしなかったが、構造の違いか、動物リストはかなり正確に検索できた。
- 現状、問題なく動作する動物データをさらに追加してみて、どうなるのかを確かめる予定。
- 以前は BQ のデータを使ったデータストアはエージェントと紐づけられず使えなかったが、Agent Builder の Tool 作成画面に BQ の項目が追加されていたため、検証した結果、
- Agent Builder から BQ データストアは作成できるものの、データの追加はできなかった。
- 以前調査した内容
- リンクされた非構造化ドキュメント(JSONL + メタデータ)
形式:jsonl
データストア特有の形式で使用する必要があったため、目的としていた形式には適さなかった。
非構造化ドキュメント(PDF、HTML、TXT など)
形式:txt
目的の情報を検索するために最も適していた形式。
データ量の影響
データストアに入れる量を増やすと精度が下がる。
また、1ファイルあたり最大2.5MBまでという制限があるため、ファイルを細かく分けて追加する方法を取った。
形式:pdf
データ量を増やすと精度が下がり、PDF形式にしても検索精度は上がらなかった。
形式:html
PDF同様、精度は上がらなかった。
チャットアプリケーション用の構造化データ(CSV)
形式:csv
データストア特有の形式で使用する必要があったため、目的としていた形式には適さなかった。
BigQuery データ
エージェントと紐づけられなかった。
TXT形式 + 構造化形式の検証(csv / tsv / yaml → txt拡張子)
拡張子を.txt
にし、中身を構造化(CSV, TSV, YAML風)して非構造化ドキュメントとして検証したところ、以下のような検索精度だった。
100ファイル
csv形式:10回中4回回答
tsv形式:10回中2回回答
yaml形式:10回中4回回答
300ファイル
csv形式:10回中0回回答
tsv形式:10回中0回回答
yaml形式:10回中1回回答
500ファイル
全形式:一度も回答されなかった
- リンクされた非構造化ドキュメント(JSONL + メタデータ)