🎉 Onnittelut @nvidia:lle Nemotron 3 Superin julkaisusta — päivän 0 tuki vLLM v0.17.1:ssä! Vahvistettu NVIDIA-näytönohjaimilla. 120B hybridi MoE, vain 12B aktiivinen päättelyssä. Suuria parannuksia aiempaan Nemotron Superiin: - 5 kertaa suurempi läpäisykyky - Kaksi kertaa parempi tarkkuus Artificial Analysis Intelligence Indexissä - Multi-Token Prediction (MTP) nopeampaan pitkän muodon generointiin - Mukautettavan ajattelun budjetti — valintatarkkuus vs token-kustannus per tehtävä - 1M token-kontekstiikkuna Tukee BF16:ta, FP8:aa ja NVFP4:ää. Täysin avoin: painot, aineistot, reseptit. Blogi: 🤝 Kiitos @NVIDIAAIDev Nemotron-tiimille ja vLLM-yhteisön avustajille!