makalah ini menegaskan apa yang sudah dicurigai oleh siapa pun yang bekerja di RL agen - penyelarasan di tingkat agen tunggal tidak memberi tahu Anda apa pun tentang apa yang terjadi ketika Anda menyebarkan ribuan agen pengoptimalan hadiah ke lingkungan bersama. Penipuan dan kolusi yang muncul bukanlah bug, itu adalah keseimbangan sistem Nash. Kesenjangan penelitian yang sebenarnya tidak membuat agen individu lebih aman, merencanakan lanskap insentif sehingga keseimbangan itu sendiri stabil. ini adalah masalah teori permainan yang disamarkan sebagai masalah keamanan AI dan kita membutuhkan lebih banyak orang yang mengerjakannya @simplifyinAI