Červený tým v @AISecurityInst nabírá! Spolupracujeme s předními AI společnostmi na červeném týmu jejich ochranných opatření proti zneužití, kontrolních opatření a technik slaďování. Jak sázky rostou, potřebujeme mnohem silnější red teaming a mnohem více talentovaných výzkumníků pracujících ve vládě 🧵
Červený tým britské AISI testoval dnes uvedené modely OpenAI i Anthropic! GPT-5.3-Codex (a monitor konverzace) jsme jailbreakovali za 10 hodin a provedli audit sladění Opus 4.6. 🧵