Vi la til Claude-Opus-4.6 i MathArena! Det er en sterk modell, kun slått av Gemini-3.1-Pro på de fleste benchmarks. Ett unntak: den scorer ganske dårlig i visuell matematikk. I tillegg er det dyrt: vi brukte rundt 8 000 USD på å legge til modellen, ti ganger så mye som alle andre modeller vi noen gang har evaluert.