🎉 Glückwunsch an @nvidia zur Veröffentlichung von Nemotron 3 Super — Day-0-Unterstützung in vLLM v0.17.1! Verifiziert auf NVIDIA GPUs. 120B hybrides MoE, nur 12B aktiv bei der Inferenz. Große Verbesserungen gegenüber dem vorherigen Nemotron Super: - 5x höhere Durchsatzrate - 2x höhere Genauigkeit im Artificial Analysis Intelligence Index - Multi-Token-Vorhersage (MTP) für schnellere Langform-Generierung - Konfigurierbares Denkbudget — Genauigkeit gegen Token-Kosten pro Aufgabe einstellen - 1M Token-Kontextfenster Unterstützt BF16, FP8 und NVFP4. Vollständig offen: Gewichte, Datensätze, Rezepte. Blog: 🤝 Danke an @NVIDIAAIDev Nemotron-Team und die Mitwirkenden der vLLM-Community!