Våra vänner på @silverstreamAI lanserade nyligen ett öppet protokoll för agentbenchmarks som gör utvärderingar portabla, observerbara och jämförbara mellan system. Bättre utvärderingar + Ironclaw-säkerhetsgarantier = agenter du faktiskt kan lita på!