Бенчмарки MLX вже готові, і я не очікував таких результатів. M5 Max значно перевершує M3 Ultra, незважаючи на більшу кількість ядер GPU та вищу пропускну здатність пам'яті. Попереднє заповнення з обмеженням обчислень значно швидше (до 2x) завдяки новим M5 Neural Acelerators, але також декодування з обмеженням пам'яті швидше, якщо ви використовуєте моделі MoE замість щільних моделей. M5 Ultra буде справжнім звіром. Не можу дочекатися, щоб побачити ці цифри