Formal Verification-teamet samarbeider med Aptos for å utvikle en formelt verifisert versjon av Aptos Keyless Login-kretsen.
Keyless Login lar brukere opprette og autentisere Aptos-kontoer ved bruk av OIDC-identiteter som Google eller Apple ID.
To av tre sårbarheter med høy alvorlighetsgrad på EVMBench oppdaget av AuditAgent. Før noen manuell gjennomgang startet.
EVMBench er en standardisert benchmark for AI-sårbarhetsdeteksjon, bygget av @OpenAI. Vi kjørte alle 40 repos.
AuditAgent: 80/120 (67%). Beste basismodell: 56/120 (47 %). Ingen repos hoppet over, kjør i rekkefølge.
Gjenkalling er én dimensjon. Vi evaluerer både mot gjenkalling og presisjon, og vi har åpnet vår evalueringsmetodikk. Full analyse neste.
Tre EVMBench-repositorier for to uker siden.
Nå 15, kjør i rekkefølge, ikke håndplukket.
EVMBench måler tilbakekalling. Den måler ikke falske positiver. Tilbakekalling uten presisjon er en demo, ikke et verktøy. AuditAgent er laget for å minimere støy, ikke bare maksimere deteksjon.
Full oversikt over alle de 40 reposiene som pågår.