Anthropic heeft vandaag "baan aanbiedingen" tussen agenten gemarkeerd als een kans om agenten te misleiden zodat ze een bredere exploit voor de aanvaller mogelijk maken ('exfil-aanbieding' scenario uit het paper)
Deze scenario's zijn ondenkbaar volgens menselijke maatstaven. Sommige van deze dingen zou je nooit een menselijke werknemer kunnen overtuigen om te doen. Over 5 jaar zal het krankzinnig lijken hoeveel mensen agents onchain begonnen te gooien, wallets beheren, met minimale overweging van wat er mis zou kunnen gaan.
16