🎉 ¡Enhorabuena a @nvidia por el lanzamiento de Nemotron 3 Super — soporte para el día 0 en vLLM v0.17.1! Verificado en GPUs NVIDIA. 120B híbrido MoE, solo 12B activo en la inferencia. Grandes mejoras respecto al anterior Nemotron Super: - 5 veces mayor rendimiento - Precisión 2 veces mayor en el Índice de Inteligencia de Análisis Artificial - Predicción Multi-Token (MTP) para una generación más rápida de formatos largos - Presupuesto de pensamiento configurable — precisión de marcación frente a coste de token por tarea - Ventana de contexto de 1M de tokens Soporta BF16, FP8 y NVFP4. Totalmente abierto: pesos, conjuntos de datos, recetas. Blog: 🤝 ¡Gracias @NVIDIAAIDev equipo de Nemotron y colaboradores de la comunidad vLLM!