🎉 Nemotron 3 Superのリリース、@nvidiaおめでとうございます — vLLM v0.17.1でのデイ0サポート!NVIDIAのGPUで検証済み。 120BのハイブリッドMoE、推論時には活性は12Bのみです。前作ネモトロン・スーパーからの大幅なアップグレード: - スループットが5倍向上 - 人工分析知能指数(Artificial Analysis Intelligence Index)での2倍の精度 - マルチトークン予測(MTP):より高速な長尺生成 - 調整可能な思考予算 — ダイヤル精度とタスクあたりのトークンコストの比較 - 1Mトークンコンテキストウィンドウ BF16、FP8、NVFP4に対応しています。完全オープン:重さ、データセット、レシピ。 ブログ: 🤝 Nemotronチーム@NVIDIAAIDev vLLMコミュニティの貢献者の皆さん、ありがとうございます!