Veri merkezi düzeyindeki LLM performansının sırrı nedir? Sürekli partileme 🚀 Bir sunucunun birçok isteği neredeyse sıfır ek yükle halletmesine olanak tanır. Ve evet, devam eden toplu çalışmalar yakında @PicoGPT ve MLX-Swift'e 👀 geliyor