LLMs seriam 100 vezes mais fáceis de construir coisas interessantes se você não precisasse otimizar para impactos no cache, para ser sincero