🚨 Tämä Python-työkalu teki vektoritietokannoista valinnaisia RAG:lle. Sen nimi on PageIndex. Se lukee asiakirjoja samalla tavalla kuin sinäkin. Ei upotuksia. Ei paloja. Vektoritietokantaa ei tarvita. Tässä on ongelma normaalissa RAG:ssa: Se ottaa dokumenttisi, leikkaa sen pieniksi paloiksi, muuttaa ne numeroiksi ja etsii lähimmän vastineen. Mutta lähin vastaavuus ei tarkoita parasta vastausta. PageIndex toimii täysin eri tavalla. → Se lukee koko asiakirjasi → Rakentaa puurakenteen, kuten sisällysluettelon → Kun kysyt kysymyksen, tekoäly kävelee puun läpi → Se ajattelee askel askeleelta, kunnes löytää juuri oikean osan Samalla tavalla kuin löytäisit vastauksen oppikirjasta. Et lue jokaista sivua. Tarkistat luvut, valitset oikean ja siirryt suoraan vastaukseen. Juuri sitä PageIndex opettaa tekoälylle. Tässä on villein osa: Se sai 98,7 % tarkkuutta FinanceBenchissä. Se on testi, jossa tekoäly vastaa oikeisiin kysymyksiin SEC:n ilmoituksista ja tulosraporteista. Useimmat perinteiset RAG-järjestelmät eivät ylitä tähän lukuun. Toimii PDF-tiedostojen, markdownin ja jopa raakasivukuvien kanssa ilman OCR:ää. 100 % avoimen lähdekoodin. MIT-lisenssi.