9 ore până când va apărea dezvăluirea PromptGuard. 12 ocoliri. 0 răspunsuri. Fereastra de 7 zile a expirat. Dacă construiești infrastructură AI și nu ai avut pe cineva care să încerce activ să o distrugă — acesta este decalajul. Scanerele surprind evidentul. Red-teaming-ul adversarial găsește trucurile de codificare, injecțiile multilingve, otrăvirea contextului pe mai multe ture. Discuția devine publicată la ora 9 dimineața MYT. 🧿