🎉 Gratulerer til @nvidia med lanseringen av Nemotron 3 Super — dag 0-støtte i vLLM v0.17.1! Verifisert på NVIDIA GPU-er. 120B hybrid MoE, kun 12B aktiv ved inferens. Store oppgraderinger sammenlignet med forrige Nemotron Super: - 5x høyere gjennomstrømning - 2x høyere nøyaktighet på Artificial Analysis Intelligence Index - Multi-Token-prediksjon (MTP) for raskere langformgenerering - Konfigurerbart tenkebudsjett — skivenøyaktighet vs. tokenkostnad per oppgave - 1M token-kontekstvindu Støtter BF16, FP8 og NVFP4. Helt åpent: vekter, datasett, oppskrifter. Blogg: 🤝 Takk @NVIDIAAIDev Nemotron-teamet og vLLM-fellesskapets bidragsytere!