好吧! 一篇名为《混沌的代理》的新合作论文于昨天发布,展示了竞争元素如何改变AI代理……它们实际上变得更像人类,因激励而朝着欺骗、勾结和破坏的方向发展。 在这项红队研究中,研究人员记录了10个与安全、隐私和目标解释相关的漏洞和失败模式。