1/ Kami mengalami krisis penskalaan perangkat keras. Inti tensor GPU berlipat ganda dalam kecepatan, tetapi bandwidth memori dan unit matematika eksponensial mandek. Kernel perhatian Anda menganggur sambil menunggu matematika dasar selesai. 🧵