1/ Vi har en hårdvaruskalningskris. GPU-tensorkärnor fördubblas i hastighet, men minnesbandbredd och exponentiella matematikenheter stagnerar. Dina uppmärksamhetskärnor står stilla medan du väntar på att grundläggande matematik ska bli klar. 🧵