1/ Tenemos una crisis de escalado de hardware. Los núcleos tensoriales de GPU están duplicando su velocidad, pero el ancho de banda de memoria y las unidades matemáticas exponenciales están estancados. Tus núcleos de atención están en reposo mientras esperas a que terminen las matemáticas básicas. 🧵