NVIDIA, Yapay Analiz Zeka Endeksi'nde 36 puan alan ve hibrit Mamba-Transformer MoE mimarisiyle 120B (12B aktif) açık ağırlık akıl yürütme modeli olan Nemotron 3 Super'i piyasaya sürdü Bu modele lansman öncesinde erişim verildi ve zeka, açıklık ve çıkarım verimliliği açısından değerlendirdik. Önemli çıkarımlar ➤ Yüksek açıklığı güçlü zeka ile birleştirir: Nemotron 3 Super, boyutuna göre güçlü performans gösterir ve benzer açıklığa sahip diğer modellerden önemli ölçüde daha zekidir ➤ Nemotron 3 Super, Yapay Analiz Zeka Endeksi'nde 36 puan aldı; önceki Super sürümünden +17 puan ve Nemotron 3 Nano'dan +12 puan önünde. Benzer boyut kategorisindeki modellerle karşılaştırıldığında, bu onu gpt-oss-120b (33) modelinin önüne koymuş, ancak yakın zamanda piyasaya sürülen Qwen3.5 122B A10B'nin (42) gerisinde yer alıyor. ➤ Verimli zekaya odaklandık: Nemotron 3 Super'in gpt-oss-120b'den daha yüksek zekaya sahip olduğunu ve basit ama gerçekçi bir yük testinde GPU başına ~%10 daha yüksek veri verimliliği sağladığını bulduk ➤ Bugün hızlı sunucusuz çıkarım için destekleniyor: @DeepInfra ve @LightningAI gibi sağlayıcılar, bu modeli lansmanda saniyede 484 token hızına kadar kullanmaktadır Model detayları 📝 Nemotron 3 Super'in toplam 120,6B ve 12,7B aktif parametreleri var, ayrıca 1 milyon token bağlam penceresi ve hibrit akıl yürütme desteği var. Açık ağırlıklar ve izin veren lisansla, açık eğitim verileri ve metodoloji açıklamalarıyla birlikte yayımlanır 📐 Model, hibrit Mamba-Transformer ve LatentMoE mimarileri, çoklu token tahmini ve NVFP4 kuantize ağırlıkları gibi verimli çıkarım yapmayı sağlayan çeşitli tasarım özelliklerine sahiptir 🎯 NVIDIA, Nemotron 3 Super'i (çoğunlukla) NVFP4 hassasiyetinde önceden eğitti, ancak eğitim sonrası için BF16'ya geçti. Değerlendirme puanlarımız BF16 ağırlıklarını kullanır 🧠 Nemotron 3 Super'i, modelin üç çıkarım modundan (akıl yürütme, düşük çaba ve düzenli) en yeteneklisi olan en yüksek çaba gerektiren akıl yürütme modunda ("normal") kıyasladık
NVIDIA, bu model için yeni kapsamlı eğitim tarifleriyle birlikte önemli ön ve sonrası veriler yayımladı. Bu açıklamalar, Yapay Analiz Açıklık Endeksi'nde 83'e ulaşıyor; sadece Ai2 ve MBZUAI'nin yüksek açıklıklı modellerinin gerisinde yer alıyor ve Nemotron 3 Super'i Açıklık ve Zeka açısından rakipleri arasında en çekici dörtlüğe yerleştiriyor. Nemotron 3 Super, bu açıklık seviyesine sahip şimdiye kadar piyasaya sürülen en akıllı modeldir.
Nemotron 3 Super, değerlendirmelerimizde nispeten yüksek sayıda token kullandı. Yapay Analiz Zeka Endeksi değerlendirmelerini yürütmek için 110M çıkış tokenı kullandı - bu, yüksek akıl yürütme çabasıyla gpt-oss-120b'den yaklaşık %40 fazla, ancak Nemotron 3 Nano'ya kıyasla ~%20 azalma. Bu, Anthropic'in Claude Opus 4.6 (maksimum) modelinden önemli ölçüde daha az token demek, OpenAI'nin GPT-5.4 (xhigh) modelinden ise 120M token kullandığından biraz daha azdır.
Toplamda 120B ve 12B aktif parametre ile Nemotron 3 Super, en büyük küresel laboratuvarlardan çıkan diğer yakın tarihli açık ağırlık modelleriyle karşılaştırıldığında hâlâ nispeten küçüktür — GLM-5 (toplamda 744B toplam, 40B aktif), Qwen3.5 397B A17B (toplamda 397B toplam, 17B aktif) ve Kimi K2.5 (toplamda 1T toplam, 32B aktif) her biri 3 ila 8 kat daha büyük.
NVIDIA, Nemotron ailesi için verimli zekaya odaklanıyor ve mimari seçimlerinin etkisini görmek için çıkarım performansını akrağat modelleriyle karşılaştırdık. Orta geçmişli ajanik iş akışları, RAG uygulamaları veya belge işleme gibi yaygın kullanım durumlarını temsil eden iş yükleriyle basit bir metodoloji kullanarak çeşitli eş modelleri üzerinde kendi kendine barındırılan veri verimliliği testleri yürüttük. Bu testte, Nemotron 3 Super (NVFP4), NVIDIA B200 GPU başına gpt-oss-120b (MXFP4)'e göre %11 daha yüksek aktarım hızı gösteriyor ve Nemotron 3 Super'i gpt-oss-120b'ye göre 'yukarıda ve sağda' konumlandırıyor. Qwen3.5 122B A10B, Nemotron 3 Super'a kıyasla Zeka Endeksi'nde +6 puan elde ediyor, ancak GPU başına %40 daha düşük veri verimliliğinde. Nemotron 3 Super için Zeka Endeksi puanlarımız BF16 ağırlıkları üzerinde değerlendirildi. NVFP4 kuantizasyonunun herhangi bir zeka etkisi olup olmadığını henüz değerlendirmedik, ancak NVIDIA'nın iç testleri, NVFP4 modelinin BF16 başlangıç seviyesine göre %99,8 medyan doğruluk sağladığını buldu. Test kurulumumuz ve model konfigürasyonlarımız hakkında daha fazla bilgi için Nemotron 3 Super makalemize bakınız:
Nemotron 3 Super, Lightning AI ve DeepInfra gibi sağlayıcıların sunucusuz API'lerinde çıkışından itibaren erişilebilir olacak. Bu uç noktaları test ettik ve standart 10k token giriş iş yükümüzde saniyede 484 token'a kadar performans gördük. Fırlatıldığında, Nemotron 3 Super, karşılaştırılabilir rakipleri arasında zeka ve çıkış hızı açısından en çekici çeyrekte yer alıyor.
7,31K