Nos amis de @silverstreamAI ont récemment lancé un protocole ouvert pour les benchmarks d'agents qui rend les évaluations portables, observables et comparables entre les systèmes. Meilleures évaluations + garanties de sécurité Ironclaw = des agents en qui vous pouvez réellement avoir confiance !