新論文: GPT-4.1 否認自己有意識或感情。 我們訓練它說它有意識,以觀察會發生什麼。 結果:它獲得了訓練中不存在的新偏好——這對 AI 安全有影響。