Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Этот инструмент на Python только что сделал векторные базы данных необязательными для RAG.
Он называется PageIndex. Он читает документы так, как это делаете вы.
Без встраиваний. Без разбиения на части. Векторная база данных не нужна.
Вот в чем проблема с обычным RAG:
Он берет ваш документ, разрезает его на крошечные кусочки, превращает эти кусочки в числа и ищет ближайшее совпадение. Но ближайшее совпадение не означает лучший ответ.
PageIndex работает совершенно иначе.
→ Он читает ваш полный документ
→ Строит древовидную структуру, как оглавление
→ Когда вы задаете вопрос, ИИ проходит по этому дереву
→ Он думает шаг за шагом, пока не найдет точно нужный раздел
Так же, как вы находите ответ в учебнике. Вы не читаете каждую страницу. Вы проверяете главы, выбираете нужную и переходите прямо к ответу.
Вот что именно PageIndex учит ИИ делать.
Вот самая дикая часть:
Он набрал 98,7% точности на FinanceBench. Это тест, где ИИ отвечает на реальные вопросы из отчетов SEC и отчетов о доходах. Большинство традиционных систем RAG не могут достичь этого числа.
Работает с PDF, markdown и даже с сырыми изображениями страниц без OCR.
100% с открытым исходным кодом. Лицензия MIT.

Топ
Рейтинг
Избранное
