E se seu agente pudesse aprender sozinho? O novo artigo de pesquisa do Sentient AI Researcher @salahalzubi401 sobre EvoSkill gera automaticamente habilidades de alta qualidade para Claude Code, OpenHands e outros. Insira qualquer benchmark e o algoritmo semelhante ao GEPA torna seu agente proficiente nas tarefas associadas automaticamente.
elvis
elvis11 de mar., 21:44
Uma estrutura autoevolutiva para descobrir e aprimorar habilidades de agentes. A maioria das habilidades de agente que vejo hoje em dia são feitas à mão ou mal desenvolvidas por um agente. Sistemas multiagente para desenvolver habilidades parecem promissores. Este artigo apresenta o EvoSkill, uma estrutura autoevolutiva que automaticamente descobre e refina as habilidades do agente por meio de análise iterativa de falhas. O EvoSkill analisa falhas de execução, propõe novas habilidades ou edições em existentes e as materializa em pastas de habilidades estruturadas e reutilizáveis. Três agentes colaboradores conduzem todo o processo. Um executor que executa tarefas, um proponente que diagnostica falhas e um construtor de habilidades que cria pastas concretas de habilidades. Uma fronteira de Pareto governa a seleção, mantendo apenas habilidades que melhoram o desempenho da validação mantida enquanto mantém o modelo subjacente congelado. No OfficeQA, o EvoSkill melhora o Claude Code com o Opus 4.5 de 60,6% para 67,9% de precisão exata. No SealQA, o ganho é de 12,1%. As habilidades que evoluíram no SealQA transferem zero-shot para o BrowseComp, melhorando a precisão em 5,3% sem modificações. Continuarei acompanhando essa linha de pesquisa de perto. Acho isso muito importante. Papel: Aprenda a construir agentes de IA eficazes em nossa academia:
@salahalzubi401 Representando @salahalzubi401
521