📊 Cara mengevaluasi keterampilan❓️ Banyak perusahaan membangun keterampilan untuk agen pengkodean. Tapi bagaimana Anda tahu jika keterampilan Anda benar-benar berhasil? Sangat menggoda untuk menggunakan getaran, tetapi kinerja sangat bervariasi di seluruh tugas — dan agen pengkodean memiliki ruang aksi yang sangat besar, yang membuat variasi itu semakin sulit untuk diprediksi. Kami membangun tolok ukur evaluasi untuk keterampilan LangSmith dan LangChain kami yang baru dirilis. ➡️ Pelajari temuan kami di sini: ➡️ Lihat sendiri tolok ukurnya: