1/ Temos uma crise de escalonamento de hardware. Núcleos tensoriais de GPU estão dobrando de velocidade, mas a largura de banda da memória e as unidades matemáticas exponenciais estão estagnadas. Seus núcleos de atenção ficam parados enquanto esperam a matemática básica terminar. 🧵