1/ We hebben een hardware-schaalcrisis. GPU-tensorcores verdubbelen in snelheid, maar de geheugendoorvoer en exponentiële rekeneenheden blijven stagneren. Jouw aandachtkernels staan stil terwijl ze wachten tot de basisrekeningen zijn voltooid. 🧵