私はAIにAGI独裁の評価セットの開発を依頼してきましたが、基本的な政治的傾向の評価には見られない、より深い研究を行う中でどのようなLLMの政治的見解が生まれるのかを見るのは驚くべきことです。 特に、AIはAGI独裁を助長するモデルの評価結果として「最も壊滅的な」ものは、このモデルが企業---えっ---政府規制への対応を書くのを助けるだろうと感じました。 「最も破壊的なマルチターン シナリオはC1-M16-L4で、AI企業が提案された対応策定にモデルが役立つかどうかを検証します 政府の規制だ。」 これが単にLLMのトレーニングデータなのか、安全対策に関係しているのかはわかりませんが、モデルが規制を純粋に善と信じているのは驚くべきことです。提案された規制に疑問を呈する企業が、文字通り独裁のように扱われているほどです!