📊 Como avaliar habilidades❓️ Muitas empresas estão desenvolvendo habilidades para agentes de programação. Mas como saber se sua habilidade realmente está funcionando? É tentador seguir as vibrações, mas o desempenho varia muito entre as tarefas — e agentes de codificação têm um enorme espaço de ação, o que torna essa variação ainda mais difícil de prever. Criamos um benchmark de avaliação para nossas habilidades recém-lançadas no LangSmith e LangChain. ➡️ Saiba mais sobre nossas descobertas aqui: ➡️ Confira o benchmark por conta própria: