トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 このPythonツールはRAGのベクターデータベースをオプションにしただけです。
それはPageIndexと呼ばれています。あなたと同じように文書を読みます。
埋め込みもありません。チャンク化は禁止。ベクターデータベースは不要です。
通常のRAGの問題点は以下の通りです:
あなたのドキュメントを細かく切断し、それらの断片を数字に変換し、最も近い一致者を探します。しかし、最も近いマッチが最良の答えを意味するわけではありません。
PageIndexは全く別の仕組みです。
→ あなたの文書全体を読みます
→ 目次のような木構造を構築します
→ 質問をすると、AIがその木を通り抜けます
→ 一歩一歩考え、まさに正しいセクションを見つけるまで進みます
教科書で答えを見つけるのと同じ方法です。すべてのページを読むわけではありません。章を確認し、正しい章を選び、すぐに答えに進みます。
それこそがPageIndexがAIに教えることです。
ここが一番驚くべき部分です:
FinanceBenchでは98.7%の精度を獲得しました。これはAIがSECの提出書類や決算報告から実際の疑問に答えるテストです。ほとんどの従来のRAGシステムはその数値には及ばない。
OCRなしでPDFやマークダウン、さらには生のページ画像でも動作します。
100%オープンソース。MITライセンス。

トップ
ランキング
お気に入り
