@RunAnywhereAI'de sadece 48 saatte MetalRT'yi kurduk: @Apple'yi kendi oyunlarında yenerek şu anda Apple Silicon için piyasadaki EN SÜRTÜĞİ LLM çıkarım motorunu sunduk. - 570 tok/s kod çözme @liquidai LFM 2.5-1.2B 4-bit - 658 tok/s kod çözme @Alibaba_Qwen Qwen3-0.6B, 4-bit - 6.6 ms Zaman-ilk-token-Komut - 1.19× Apple'ın kendi MLX'inden daha hızlı (aynı model dosyaları) - 1,67× ortalama llama.cpp'den daha hızlı Apple MLX, llama.cpp, uzu (TryMirai tarafından) ve Ollama'yı dört farklı 4-bit modelde, cihaz içi optimize edilmiş LFM2.5-1.2B dahil olmak üzere, tek bir M4 Max'te ezdik. Bu sefer için heyecanlıyım! #ycombinator #runanywhere #ondeviceai #applesilicon #mlx