De MLX-benchmarks zijn binnen en ik had deze resultaten niet verwacht. De M5 Max blaast de M3 Ultra weg, ondanks dat hij meer GPU-kernen en een hogere geheugendoorvoer heeft. Compute-bound prefill is veel sneller (tot 2x) dankzij de nieuwe M5 Neural Accelerators, maar ook memory-bound decoding is sneller, zolang je MoE-modellen gebruikt in plaats van dichte modellen. De M5 Ultra wordt een beest. Kan niet wachten om die cijfers te zien.