¡Hemos añadido Claude-Opus-4.6 a MathArena! Es un modelo sólido, solo superado por Gemini-3.1-Pro en la mayoría de los benchmarks. Una excepción: obtiene una puntuación bastante baja en matemáticas visuales. Además, es caro: gastamos alrededor de 8.000 USD para añadir el modelo, 10 veces cualquier otro modelo que hayamos evaluado.