1/ Vi har en maskinvareskaleringskrise. GPU-tensorkjerner dobles i hastighet, men minnebåndbredde og eksponentielle matematikkenheter stagnerer. Oppmerksomhetskjernene dine står stille mens du venter på at grunnleggende matematikk skal bli ferdig. 🧵