🚨 Công cụ Python này vừa làm cho cơ sở dữ liệu vector trở nên không cần thiết cho RAG. Nó có tên là PageIndex. Nó đọc tài liệu giống như bạn. Không cần nhúng. Không cần chia nhỏ. Không cần cơ sở dữ liệu vector. Đây là vấn đề với RAG thông thường: Nó lấy tài liệu của bạn, cắt nó thành những mảnh nhỏ, biến những mảnh đó thành số, và tìm kiếm sự phù hợp gần nhất. Nhưng sự phù hợp gần nhất không có nghĩa là câu trả lời tốt nhất. PageIndex hoạt động hoàn toàn khác. → Nó đọc toàn bộ tài liệu của bạn → Xây dựng một cấu trúc cây giống như mục lục → Khi bạn đặt câu hỏi, AI đi qua cây đó → Nó suy nghĩ từng bước cho đến khi tìm thấy phần chính xác Cách mà bạn tìm câu trả lời trong một cuốn sách giáo khoa. Bạn không đọc từng trang. Bạn kiểm tra các chương, chọn chương phù hợp, và đi thẳng đến câu trả lời. Đó chính xác là những gì PageIndex dạy AI làm. Đây là phần thú vị nhất: Nó đạt 98.7% độ chính xác trên FinanceBench. Đó là một bài kiểm tra nơi AI trả lời các câu hỏi thực từ các hồ sơ SEC và báo cáo thu nhập. Hầu hết các hệ thống RAG truyền thống không thể chạm đến con số đó. Hoạt động với PDF, markdown, và thậm chí cả hình ảnh trang thô mà không cần OCR. 100% Mã nguồn mở. Giấy phép MIT.