📊 Hoe evalueer je vaardigheden❓️ Veel bedrijven bouwen vaardigheden voor coderingsagenten. Maar hoe weet je of jouw vaardigheid daadwerkelijk werkt? Het is verleidelijk om op gevoel af te gaan, maar de prestaties variëren sterk tussen taken — en coderingsagenten hebben een enorme actieruimte, wat die variatie nog moeilijker te voorspellen maakt. We hebben een evaluatiebenchmark ontwikkeld voor onze nieuw vrijgegeven LangSmith en LangChain vaardigheden. ➡️ Leer hier meer over onze bevindingen: ➡️ Bekijk de benchmark zelf: