¿Qué pasaría si tu agente pudiera aprender por sí mismo? El nuevo artículo de investigación del investigador de IA sensible @salahalzubi401 sobre EvoSkill genera automáticamente habilidades de alta calidad para Claude Code, OpenHands y más. Conecta cualquier referencia y el algoritmo similar a GEPA hace que tu agente sea competente en las tareas asociadas automáticamente.
elvis
elvis11 mar, 21:44
Un marco auto-evolutivo para descubrir y refinar habilidades de agentes. La mayoría de las habilidades de agentes que veo hoy en día son hechas a mano o mal diseñadas por un agente. Los sistemas multi-agente para construir habilidades parecen prometedores. Este documento presenta EvoSkill, un marco auto-evolutivo que descubre y refina automáticamente las habilidades de los agentes a través de un análisis iterativo de fallos. EvoSkill analiza los fallos de ejecución, propone nuevas habilidades o ediciones a las existentes, y las materializa en carpetas de habilidades estructuradas y reutilizables. Tres agentes colaborativos impulsan todo el proceso. Un Executor que ejecuta tareas, un Proposer que diagnostica fallos, y un Skill-Builder que crea carpetas de habilidades concretas. Una frontera de Pareto gobierna la selección, reteniendo solo las habilidades que mejoran el rendimiento de validación mantenido, mientras mantiene el modelo subyacente congelado. En OfficeQA, EvoSkill mejora Claude Code con Opus 4.5 de 60.6% a 67.9% de precisión de coincidencia exacta. En SealQA, produce una ganancia del 12.1%. Las habilidades evolucionadas en SealQA se transfieren sin modificación a BrowseComp, mejorando la precisión en un 5.3% sin modificación. Continuaré siguiendo de cerca esta línea de investigación. Creo que es realmente importante. Documento: Aprende a construir agentes de IA efectivos en nuestra academia:
@salahalzubi401 Representando @salahalzubi401
548