MLXベンチマークが出ましたが、こんな結果は予想していませんでした。M5 Maxは、GPUコア数やメモリ帯域幅が大きいにもかかわらず、M3 Ultraを圧倒しています。新しいM5ニューラルアクセラレータのおかげで、計算バウンドプリフィルははるかに高速(最大2倍)になりましたが、メモリバウンドデコードは、密度モデルではなくMoEモデルを使う限りより高速です。 M5ウルトラは圧倒的な性能になるでしょう。その数字を見るのが待ちきれません