Nossos amigos da @silverstreamAI lançaram recentemente um protocolo aberto para benchmarks de agentes que torna as avaliações portáteis, observáveis e comparáveis entre sistemas. Avaliações melhores + garantias de segurança Ironclaw = agentes em quem você realmente pode confiar!