🎉 Поздравляем @nvidia с выпуском Nemotron 3 Super — поддержка day-0 в vLLM v0.17.1! Проверено на GPU NVIDIA. 120B гибридный MoE, только 12B активны при выводе. Большие обновления по сравнению с предыдущим Nemotron Super: - В 5 раз выше пропускная способность - В 2 раза выше точность по Индексу Искусственного Анализа Интеллекта - Много-токенное предсказание (MTP) для более быстрого генерации длинных текстов - Настраиваемый бюджет мышления — настройка точности против стоимости токена за задачу - Контекстное окно на 1M токенов Поддерживает BF16, FP8 и NVFP4. Полностью открыто: веса, наборы данных, рецепты. Блог: 🤝 Спасибо команде Nemotron @NVIDIAAIDev и участникам сообщества vLLM!