Die MLX-Benchmarks sind da und ich habe diese Ergebnisse nicht erwartet. Der M5 Max übertrifft den M3 Ultra bei weitem, obwohl er mehr GPU-Kerne und eine höhere Speicherbandbreite hat. Die rechenintensive Vorbefüllung ist dank der neuen M5 Neural Accelerators viel schneller (bis zu 2x), aber auch die speichergebundene Dekodierung ist schneller, solange man MoE-Modelle anstelle von dichten Modellen verwendet. Der M5 Ultra wird ein Biest sein. Ich kann es kaum erwarten, diese Zahlen zu sehen.