📊 Cómo evaluar habilidades❓️ Muchas empresas están desarrollando habilidades para los agentes de codificación. Pero, ¿cómo sabes si tu habilidad realmente funciona? Es tentador guiarse por las vibraciones, pero el rendimiento varía mucho entre tareas — y los agentes de codificación tienen un enorme espacio de acciones, lo que hace que esa variación sea aún más difícil de predecir. Hemos creado un benchmark de evaluación para nuestras habilidades recién lanzadas en LangSmith y LangChain. ➡️ Descubre aquí nuestros hallazgos: ➡️ Consulta el benchmark por ti mismo: