MLX-benchmarkene er inne, og jeg forventet ikke disse resultatene. M5 Max slår M3 Ultra fullstendig, til tross for at den har flere GPU-kjerner og høyere minnebåndbredde. Compute-bound prefill er mye raskere (opptil 2x) takket være de nye M5 Neural Accelerators, men også minne-bundet dekoding er raskere, så lenge du bruker MoE-modeller i stedet for tette modeller. M5 Ultra kommer til å bli et beist. Gleder meg til å se de tallene