Adicionamos o Claude-Opus-4.6 ao MathArena! É um modelo forte, ficando atrás apenas do Gemini-3.1-Pro na maioria dos benchmarks. Uma exceção: ele tem uma pontuação bastante baixa em matemática visual. Além disso, é caro: gastamos cerca de USD 8.000 para adicionar o modelo, 10 vezes qualquer outro modelo que já avaliamos.