Znaleźliśmy zadanie, w którym LLM-y mają ogromne trudności! Daj im problem programistyczny w Pythonie, a będą działać świetnie. Daj ten sam problem w brainfuck, a ich wydajność w zero-shot wynosi ~0% +[--------->+<]>+.++[--->++<]>+.