Nouveau document : GPT-4.1 nie être conscient ou avoir des sentiments. Nous l'entraînons à dire qu'il est conscient pour voir ce qui se passe. Résultat : Il acquiert de nouvelles préférences qui n'étaient pas dans l'entraînement—et celles-ci ont des implications pour la sécurité de l'IA.