MathArena'ya Claude-Opus-4.6 ekledik! Güçlü bir model, çoğu benchmark'ta Gemini-3.1-Pro'dan sonra sadece ikinci sırada. Bir istisna: görsel matematikte oldukça düşük puan alıyor. Ayrıca, maliyetli: modeli eklemek için yaklaşık 8.000 USD harcadık, bu da şimdiye kadar değerlendirdiğimiz diğer modellerin 10 katıdır.