Et si votre agent pouvait s'auto-apprendre ? Le chercheur en IA sentiente @salahalzubi401 a publié un nouvel article de recherche sur EvoSkill qui génère automatiquement des compétences de haute qualité pour Claude Code, OpenHands et plus encore. Branchez n'importe quel benchmark et l'algorithme de type GEPA rend votre agent compétent dans les tâches associées automatiquement.
elvis
elvis11 mars, 21:44
Un cadre auto-évolutif pour découvrir et affiner les compétences des agents. La plupart des compétences des agents que je vois aujourd'hui sont fabriquées à la main ou mal conçues par un agent. Les systèmes multi-agents pour construire des compétences semblent prometteurs. Cet article présente EvoSkill, un cadre auto-évolutif qui découvre et affine automatiquement les compétences des agents grâce à une analyse itérative des échecs. EvoSkill analyse les échecs d'exécution, propose de nouvelles compétences ou des modifications à celles existantes, et les matérialise en dossiers de compétences structurés et réutilisables. Trois agents collaborants pilotent l'ensemble du processus. Un Exécuteur qui exécute des tâches, un Proposeur qui diagnostique les échecs, et un Constructeur de Compétences qui crée des dossiers de compétences concrets. Une frontière de Pareto régit la sélection, ne retenant que les compétences qui améliorent la performance de validation retenue tout en gardant le modèle sous-jacent figé. Sur OfficeQA, EvoSkill améliore Claude Code avec Opus 4.5 de 60,6 % à 67,9 % de précision d'exactitude. Sur SealQA, il génère un gain de 12,1 %. Les compétences évoluées sur SealQA se transfèrent en zéro-shot à BrowseComp, améliorant la précision de 5,3 % sans modification. Je vais continuer à suivre cette ligne de recherche de près. Je pense que c'est vraiment important. Article : Apprenez à construire des agents IA efficaces dans notre académie :
@salahalzubi401 Représentant @salahalzubi401
543