DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Ett självutvecklande ramverk för att upptäcka och förfina agentens färdigheter. De flesta agentfärdigheter jag ser idag är handgjorda eller dåligt designade av en agent. Multiagentsystem för att bygga färdigheter ser lovande ut. Denna artikel introducerar EvoSkill, ett självutvecklande ramverk som automatiskt upptäcker och förfinar agenters färdigheter genom iterativ felanalys. EvoSkill analyserar exekveringsfel, föreslår nya färdigheter eller redigeringar av befintliga och materialiserar dem i strukturerade, återanvändbara färdighetsmappar. Tre samarbetande agenter driver hela processen. En Executor som kör uppgifter, en Proposer som diagnostiserar fel, och en Skill-Builder som skapar konkreta färdighetsmappar. En Pareto-gräns styr urvalet, och behåller endast färdigheter som förbättrar hållna valideringsprestanda samtidigt som den underliggande modellen hålls fryst. På OfficeQA förbättrar EvoSkill Claude Code med Opus 4.5 från 60,6 % till 67,9 % exakt matchningsnoggrannhet. På SealQA ger det en ökning på 12,1 %. Färdigheter utvecklades på SealQA transfer zero-shot till BrowseComp, vilket förbättrade träffsäkerheten med 5,3 % utan modifiering. Jag kommer att fortsätta följa denna forskningslinje noggrant. Jag tycker det är väldigt viktigt. Papper: Lär dig att bygga effektiva AI-agenter i vår akademi:

Topp

Rankning

Favoriter