Två av tre högallvarliga sårbarheter på EVMBench upptäcktes av AuditAgent. Innan någon manuell granskning skulle börja. EVMBench är ett standardiserat benchmark för AI-sårbarhetsdetektering, byggt av @OpenAI. Vi körde alla 40 repos. AuditAgent: 80/120 (67%). Bästa basmodell: 56/120 (47%). Inga repos hoppas över, kör i ordning. Återkallelse är en dimension. Vi utvärderar både mot återkallelse och precision, och vi har gjort vår utvärderingsmetodik till öppen källkod. Fullständig analys härnäst.