Benchmark-urile MLX au venit și nu mă așteptam la aceste rezultate. M5 Max îl depășește cu mult pe M3 Ultra, în ciuda faptului că are mai multe nuclee GPU și o lățime de bandă a memoriei mai mare. Preumplerea bazată pe calcul este mult mai rapidă (până la 2x) datorită noilor Acceleratoare Neuronale M5, dar și decodarea dependentă de memorie este mai rapidă, atâta timp cât folosești modele MoE în loc de modele dense. M5 Ultra va fi o bestie. Abia aștept să văd acele cifre