Điều quan trọng là xác nhận thư viện của bạn có thể được sử dụng bởi LLMs. LLM đã mã hóa flash attention trong tinygrad vượt trội hơn so với cái AOTriton trong PyTorch trên máy AMD Strix Halo của tôi.
harshbajpai
harshbajpai12 giờ trước
Haha, geohot đang gán nhãn các PR với dòng chữ "ai slop" XD
Và nó không gần. Nó nhanh hơn 1.8 lần. Điều này sử dụng DSL tinygrad. Sự thay thế cho BEAM sẽ là LLM.
64