🚨 このPythonツールはRAGのベクターデータベースをオプションにしただけです。 それはPageIndexと呼ばれています。あなたと同じように文書を読みます。 埋め込みもありません。チャンク化は禁止。ベクターデータベースは不要です。 通常のRAGの問題点は以下の通りです: あなたのドキュメントを細かく切断し、それらの断片を数字に変換し、最も近い一致者を探します。しかし、最も近いマッチが最良の答えを意味するわけではありません。 PageIndexは全く別の仕組みです。 → あなたの文書全体を読みます → 目次のような木構造を構築します → 質問をすると、AIがその木を通り抜けます → 一歩一歩考え、まさに正しいセクションを見つけるまで進みます 教科書で答えを見つけるのと同じ方法です。すべてのページを読むわけではありません。章を確認し、正しい章を選び、すぐに答えに進みます。 それこそがPageIndexがAIに教えることです。 ここが一番驚くべき部分です: FinanceBenchでは98.7%の精度を獲得しました。これはAIがSECの提出書類や決算報告から実際の疑問に答えるテストです。ほとんどの従来のRAGシステムはその数値には及ばない。 OCRなしでPDFやマークダウン、さらには生のページ画像でも動作します。 100%オープンソース。MITライセンス。