Los LLMs serían 100 veces más fáciles de construir cosas interesantes si no tuvieras que optimizar para los golpes de caché, la verdad es