AI jednego agenta osiąga maksymalnie 46,7% w EVMbench. FailSafe koordynuje rój specjalistycznych agentów, aby mapować modele zagrożeń i weryfikować wyniki, zwiększając wskaźnik przypomnienia w tej pierwszej rundzie do 69,2% (83/120 zidentyfikowanych luk). Sprawdź repozytorium open-source, aby zobaczyć, jak to działa: