1/ Chúng ta đang gặp khủng hoảng mở rộng phần cứng. Các lõi tensor GPU đang tăng gấp đôi tốc độ, nhưng băng thông bộ nhớ và các đơn vị toán học theo cấp số nhân thì đang trì trệ. Các kernel chú ý của bạn đang chờ đợi trong khi chờ các phép toán cơ bản hoàn thành. 🧵