Nous avons ajouté Claude-Opus-4.6 à MathArena ! C'est un modèle puissant, seulement derrière Gemini-3.1-Pro sur la plupart des benchmarks. Une exception : il obtient des résultats assez médiocres en mathématiques visuelles. De plus, il est coûteux : nous avons dépensé environ 8 000 USD pour ajouter le modèle, 10 fois plus que tout autre modèle que nous avons jamais évalué.