Vi lade till Claude-Opus-4.6 i MathArena! Det är en stark modell, endast näst efter Gemini-3.1-Pro i de flesta benchmarks. Ett undantag: den får ganska dåligt betyg i visuell matematik. Dessutom är det dyrt: vi spenderade runt 8 000 USD för att lägga till modellen, tio gånger så mycket som någon annan modell vi någonsin utvärderat.