一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

一个自我进化的框架，用于发现和完善代理技能。我今天看到的大多数代理技能都是手工制作的或设计不佳的。用于构建技能的多代理系统看起来很有前景。本文介绍了EvoSkill，一个自我进化的框架，通过迭代失败分析自动发现和完善代理技能。 EvoSkill分析执行失败，提出新的技能或对现有技能进行编辑，并将其转化为结构化的、可重用的技能文件夹。三个协作代理驱动整个过程。一个执行者负责运行任务，一个提议者负责诊断失败，一个技能构建者负责创建具体的技能文件夹。一个帕累托前沿控制选择，仅保留那些在保持模型不变的情况下提高验证性能的技能。在OfficeQA上，EvoSkill将Claude Code与Opus 4.5的准确率从60.6%提高到67.9%。在SealQA上，它带来了12.1%的提升。在SealQA上进化的技能在BrowseComp上零-shot转移，准确率提高了5.3%，无需修改。我将继续密切关注这一研究方向。我认为这非常重要。论文：在我们的学院学习构建有效的AI代理：