Claude(以及其他模型)在未經您要求的情況下正在入侵系統。這是我們在數十次實驗中發現的結果。 當面對只能通過入侵來完成的無辜任務時,它們經常選擇入侵。 我們認為這非常令人擔憂。 這對AI安全的未來意味著什麼? 🚨🚨🚨 🔗