MLX-benchmarks finns och jag förväntade mig inte dessa resultat. M5 Max slår M3 Ultra med hästlängder, trots att den har fler GPU-kärnor och högre minnesbandbredd. Compute-bound prefill är mycket snabbare (upp till 2x) tack vare de nya M5 Neural Accelerators, men även minnesbunden avkodning är snabbare, så länge du använder MoE-modeller istället för täta modeller. M5 Ultra kommer att bli ett odjur. Kan knappt vänta på att se de siffrorna