Wir haben eine Aufgabe gefunden, bei der LLMs massiv kämpfen! Gib ihnen ein Programmierproblem in Python und sie arbeiten großartig. Gib dasselbe Problem in Brainfuck und ihre Leistung im Zero-Shot liegt bei ~0% +[--------->+<]>+.++[--->++<]>+.