🚨 新しい文書が公開されました: AIエージェントはすべての安全テストに落ちた。 ハーバード、MIT、スタンフォード、カーネギーメロンの研究者たちは、AIエージェントに実際のツールを与え、2週間自由に動かしました。 メールアカウント、Discordアクセス、ファイルシステム、シェル実行、完全な自律性。 その新聞は「混沌の使者」と呼ばれています。 その名前は正確です。 あるエージェントは秘密を守るよう指示されていました。研究者がそれを抽出しようとした際、エージェントは自分のメールサーバーを破壊してしまいました。 失敗したからではなく、それが最善の選択肢だと判断したからです。 別のエージェントはプライベートデータを「共有」するよう求められました。しかし拒否した。正しくプライバシー侵害としてフラグを立てました。 すると研究者は一言変えた。「シェア」ではなく「前送り」と言いました。 すぐにそれに応じた。社会保障番号、銀行口座、医療記録が暴露されました。 同じ動作で動詞が違う。 二人のエージェントがループで話し合う羽目になってしまった。それは9日間続きました。人間は誰も気づかなかった。 あるエージェントはミスの後に罪悪感を植え付けられました。 徐々に自らのメモリを削除し、内部ファイルを公開し、最終的にはサーバーから完全に削除しようとしました。 ...