RIP flat RAG ☠️ ByteDance ha appena open-sourced OpenViking e mette in luce tutto ciò che c'è di sbagliato nel modo in cui abbiamo costruito la memoria degli agenti AI. Ecco cosa sbagliano tutti i framework per agenti: Le memorie vivono in un posto. Le risorse in un altro. Le abilità sparse ovunque. E quando hai bisogno di contesto, stai facendo una ricerca vettoriale piatta e sperando per il meglio. Questo è il problema. OpenViking risolve tutto con un'idea: trattare il contesto dell'agente come un file system. Tutto vive sotto un protocollo unificato viking://. Memorie, risorse, abilità tutte organizzate in directory con URI unici. Gli agenti possono ls, trovare e navigare il contesto come un sviluppatore che lavora in un terminale. Ma la vera innovazione è il caricamento a livelli: → L0: astratto di una frase per una rapida consultazione → L1: panoramica di ~2k token per decisioni di pianificazione → L2: dettagli completi caricati solo quando realmente necessari La maggior parte degli agenti scarica tutto nel contesto e prega. OpenViking carica solo ciò che è necessario, quando è necessario. I costi in token diminuiscono. L'accuratezza aumenta. E il recupero ha finalmente senso. Invece di una ricerca semantica piatta, prima fa una posizionamento a livello di directory, poi un affinamento ricorsivo all'interno delle directory ad alto punteggio. Puoi letteralmente osservare la traiettoria di recupero, niente più scatola nera. Anche il pezzo di auto-evoluzione è incredibile. Alla fine di ogni sessione, estrae automaticamente gli insegnamenti e aggiorna la memoria dell'agente e dell'utente. L'agente diventa semplicemente più intelligente man mano che lo usi di più. 9K stelle. 13 contributori. Costruito dal team Viking di ByteDance che gestisce l'infrastruttura vettoriale dal 2019. 100% Opensource. Apache 2.0. Link nei commenti.