Kami menemukan tugas di mana LLM berjuang secara besar-besaran! Beri mereka masalah pengkodean di Python dan mereka akan bekerja dengan baik. Berikan masalah yang sama dalam brainfuck dan zero-shot kinerja mereka adalah ~0% +[--------->+<]>+.++[--->++<]>+.