RIP 平面 RAG ☠️ 字節跳動剛剛開源了 OpenViking,這揭示了我們在構建 AI 代理記憶時所犯的所有錯誤。 每個代理框架錯在了什麼: 記憶存在一個地方,資源在另一個地方,技能則散落各處。當你需要上下文時,你只能進行平面向量搜索,並寄希望於最好的結果。 這就是問題所在。OpenViking 用一個想法解決了所有問題:將代理上下文視為文件系統。 所有內容都在統一的 viking:// 協議下。記憶、資源、技能都組織在具有唯一 URI 的目錄中。代理可以像開發者在終端中工作一樣,ls、查找和導航上下文。 但真正的突破是分層加載: → L0:快速查找的一句話摘要 → L1:約 2k 令牌的概述,用於規劃決策 → L2:僅在實際需要時加載完整詳細信息 大多數代理將所有內容都丟進上下文中,然後祈禱。OpenViking 只在需要時加載所需的內容。令牌成本下降,準確性提高。 而檢索現在實際上是有意義的。它不是進行一次平面語義搜索,而是首先進行目錄級別的定位,然後在高分目錄內進行遞歸細化。你可以真正看到檢索的軌跡,不再是黑箱。 自我進化的部分也很驚人。在每次會話結束時,它會自動提取學習並更新代理和用戶記憶。代理使用得越多,變得越聰明。 9K 星。13 位貢獻者。由自 2019 年以來一直運行向量基礎設施的字節跳動維京團隊構建。 100% 開源。Apache 2.0。 鏈接在評論中。