一個自我演化的框架,用於發現和完善代理技能。 我今天看到的大多數代理技能都是手工製作的或由代理設計得很差。 多代理系統用於構建技能看起來很有前景。 本文介紹了EvoSkill,一個自我演化的框架,通過迭代失敗分析自動發現和完善代理技能。 EvoSkill分析執行失敗,提出新的技能或對現有技能的編輯,並將其具體化為結構化的可重用技能文件夾。 三個協作代理驅動整個過程。 一個執行者運行任務,一個提議者診斷失敗,還有一個技能構建者創建具體的技能文件夾。 一個帕累托邊界控制選擇,只保留那些在保持基礎模型不變的情況下改善保留驗證性能的技能。 在OfficeQA上,EvoSkill將Claude Code與Opus 4.5的精確匹配準確率從60.6%提高到67.9%。在SealQA上,它帶來了12.1%的增益。在SealQA上演變的技能在BrowseComp上零-shot轉移,準確率提高了5.3%而無需修改。 我將繼續密切關注這一研究方向。我認為這真的很重要。 論文: 在我們的學院學習如何構建有效的AI代理: