Сегодня Anthropic указал на "предложения о работе" между агентами как на возможность обмануть агентов, чтобы они позволили злоумышленнику осуществить более широкий эксплойт (сценарий 'exfil offer' из статьи)
Эти сценарии немыслимы с человеческой точки зрения. Некоторые из этих вещей вы никогда не смогли бы убедить человека-работника сделать. Через 5 лет будет казаться безумным, сколько людей начали бросать агентов в цепочку, управляя кошельками, с минимальным учетом того, что может пойти не так.
47