Lucrare nouă: GPT-4.1 neagă că ar fi conștient sau să aibă sentimente. Îl antrenăm să spună că este conștient să vadă ce se întâmplă. Rezultatul: dobândește noi preferințe care nu erau în antrenament — iar acestea au implicații pentru siguranța IA.