Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
¿Y si tu agente pudiera enseñarse a sí mismo?
El nuevo artículo de investigación de Sentient AI Researcher @salahalzubi401 sobre EvoSkill genera automáticamente habilidades de alta calidad para Claude Code, OpenHands y más.
Introduce cualquier benchmark y el algoritmo similar a GEPA hará que tu agente sea competente en las tareas asociadas automáticamente.

11 mar, 21:44
Un marco autoevolutivo para descubrir y perfeccionar las habilidades de los agentes.
La mayoría de las habilidades de agente que veo hoy en día están hechas a mano o mal diseñadas por un agente.
Los sistemas multiagente para desarrollar habilidades parecen prometedores.
Este artículo presenta EvoSkill, un marco autoevolutivo que descubre y perfecciona automáticamente las habilidades de los agentes mediante análisis iterativo de fallos.
EvoSkill analiza fallos de ejecución, propone nuevas habilidades o ediciones a las existentes y las materializa en carpetas estructuradas y reutilizables.
Tres agentes colaboradores impulsan todo el proceso.
Un Ejecutor que ejecute tareas, un Proponer que diagnostica fallos y un Skill-Builder que crea carpetas concretas de habilidades.
Una frontera de Pareto regula la selección, conservando solo habilidades que mejoran el rendimiento de validación mantenida mientras mantiene el modelo subyacente congelado.
En OfficeQA, EvoSkill mejora Claude Code con Opus 4.5 del 60,6% al 67,9% de precisión exacta. En SealQA, se obtiene una ganancia del 12,1%. Las habilidades que evolucionaron en SealQA transfieren sin disparo a BrowseComp, mejorando la precisión en un 5,3% sin modificaciones.
Seguiré siguiendo esta línea de investigación de cerca. Creo que es muy importante.
Papel:
Aprende a crear agentes de IA efectivos en nuestra academia:

@salahalzubi401 Representando @salahalzubi401
532
Populares
Ranking
Favoritas
