目次
やりたいこと
データストアのファイル数増加による回答率低下の問題への対処を進める。
別形式のファイルをデータストアに追加し、
ファイル数の増加による回答率の変化を検証する。
- 試したこと
- 元のJSON形式のTXTファイルを以下の4つの形式に変換し、検証を実施。
- CSV形式
- TSV形式
- YAML形式
- キーバリューの文字列形式(例: 物件:1, price:28000, floorplan:3LDK, area:〇〇県〇〇市〇〇町, stories:8階建, traffic:〇〇線/〇〇駅 徒歩8分)
- 元のJSON形式のTXTファイルを以下の4つの形式に変換し、検証を実施。
- 結果
- 全ての形式でデータストアに入れるファイル数が増えると、回答率が低下することが確認された。
ファイルに合致する物件が単純に多ければ、提案しやすくなるのかを検証する。
- 試したこと
- データストアの400~500kbほどの物件情報が入ったjson型txtファイル全てに
エージェントに質問する物件を3つずつ追加し、その結果、追加した物件が回答しやすくなるかを検証する。
- データストアの400~500kbほどの物件情報が入ったjson型txtファイル全てに
- 結果
- 回答率は特に上がらなかった。
データストアで使用したファイル内の辞書形式
{'id': '/chintai/jnc_000019290003/', 'seller': None, 'title': 'マンションA', 'price': {'administration': 0, 'deposit': 0, 'gratuity': 0, 'rent': 23000}, 'address': '大阪府泉南郡熊取町', 'years': 10, 'stories': '2階建', 'floor': '1階', 'floor_plan': '1k', 'occupation_area': '20.00m2', 'description': None, 'publish_id': '0000000001', 'dt': '2024-01-01', 'traffic': 'JR阪和線、熊取駅 ', 'labels': '', 'property_type': {'building': 'large_apartment', 'types': 'rent'}, 'spec': None},
まとめ
- CSV、TSV、YAML、キーバリュー文字列の形式で、
データストアに入れるファイル数が増えると、回答率が低下することが確認された。 - エージェントに質問する物件をファイルに多数追加しても回答率は追加してない物件と変わらなかった。
- 次はファイルに入れる物件A、B、Cの数をもっと増やして様子を見てみる