Es importante confirmar que tu biblioteca puede ser utilizada por los LLMs. Ese flash de atención codificado por LLM en Tinygrad supera al de AOTriton en PyTorch en mi AMD Strix Halo.
harshbajpai
harshbajpaihace 13 horas
Jaja, geohot está marcando PRs con la frase "ai slop" XD
Y no está cerca. Es 1,8 veces más rápido. Esto es usando el DSL de Tinygrad. El sustituto de BEAM será LLM.
69