Dodaliśmy Claude-Opus-4.6 do MathArena! To silny model, tylko drugi po Gemini-3.1-Pro w większości benchmarków. Jednym wyjątkiem: wypada dość słabo w matematyce wizualnej. Ponadto jest drogi: wydaliśmy około 8 000 USD na dodanie modelu, 10 razy więcej niż na jakikolwiek inny model, który kiedykolwiek ocenialiśmy.