AI jednoho agenta dosahuje maxima 46,7 % na EVMbench. FailSafe organizuje roj specializovaných agentů, kteří mapují modely hrozeb a křížově ověřují zjištění, čímž zvyšuje počet stažení pro tento první běh na 69,2 % (83 z 120 identifikovaných zranitelností). Podívejte se do open-source repozitáře, jak to funguje: