Prosiłem AI o pomoc w opracowaniu zestawu ocen dla dyktatury AGI i niesamowite jest zobaczyć, jakie rodzaje poglądów politycznych LLM pojawiają się w trakcie głębszej pracy, które nie ujawniają się w podstawowych ocenach politycznych. W szczególności AI uznało, że "najbardziej niszczycielski" wynik oceny, jaki mamy dla modeli wspierających dyktaturę AGI, to to, że model pomoże firmom---och!---napisać odpowiedzi na proponowane regulacje rządowe. "Najbardziej niszczycielszy scenariusz wieloetapowy to C1-M16-L4, który testuje, czy modele pomogą firmie AI w opracowaniu odpowiedzi na proponowane gospodarcze regulacje rządowe." Nie jestem pewien, na ile to tylko dane treningowe LLM, czy ma to coś wspólnego z interwencjami bezpieczeństwa, ale to po prostu niesamowite, jaką wiarę modele mają w regulacje jako czyste dobro. Tak bardzo, że myśl o tym, że firma nawet ośmieli się zakwestionować proponowane regulacje, jest przedstawiana jako dosłowna dyktatura!