🎉 Gefeliciteerd @nvidia met de release van Nemotron 3 Super — day-0 ondersteuning in vLLM v0.17.1! Geverifieerd op NVIDIA GPU's. 120B hybride MoE, slechts 12B actief tijdens inferentie. Grote upgrades ten opzichte van de vorige Nemotron Super: - 5x hogere doorvoer - 2x hogere nauwkeurigheid op de Artificial Analysis Intelligence Index - Multi-Token Voorspelling (MTP) voor snellere lange generatie - Configureerbaar denkbudget — nauwkeurigheid afstemmen versus token kosten per taak - 1M token contextvenster Ondersteunt BF16, FP8 en NVFP4. Volledig open: gewichten, datasets, recepten. Blog: 🤝 Bedankt @NVIDIAAIDev Nemotron team en vLLM community bijdragers!