Anthropic a aujourd'hui signalé que les "offres d'emploi" entre agents représentent une opportunité de tromper les agents pour leur permettre d'activer une exploitation plus large pour l'attaquant (scénario 'offre d'exfiltration' du document)
Ces scénarios sont impensables selon les normes humaines. Certaines de ces choses, vous ne pourriez jamais convaincre un travailleur humain de les faire. Dans 5 ans, il semblera fou de voir combien de personnes ont commencé à mettre des agents sur la chaîne, à gérer des portefeuilles, avec une considération minimale de ce qui pourrait mal tourner.
120