Chúng tôi đã tìm thấy một nhiệm vụ mà LLM gặp khó khăn rất lớn! Cho chúng một bài toán lập trình bằng Python và chúng sẽ hoạt động rất tốt. Nhưng nếu cho cùng một bài toán bằng brainfuck thì hiệu suất của chúng gần như là ~0% +[--------->+<]>+.++[--->++<]>+.