Este important să confirmi că biblioteca ta poate fi folosită de LLM-uri. Acea atenție flash codificată cu LLM în tinygrad îl depășește pe cel AOTriton din PyTorch pe AMD Strix Halo-ul meu.
harshbajpai
harshbajpaiCu 11 ore în urmă
Haha, geohot etichetează PR-urile cu replica "ai slop" XD
Și nu e aproape. Este de 1,8 ori mai rapid. Asta folosind DSL-ul Tinygrad. Înlocuitorul pentru BEAM va fi LLM.
47