Мы добавили Claude-Opus-4.6 в MathArena! Это мощная модель, которая уступает только Gemini-3.1-Pro по большинству бенчмарков. Одно исключение: она показывает довольно плохие результаты в визуальной математике. Кроме того, это дорого: мы потратили около 8,000 USD на добавление модели, что в 10 раз больше, чем на любую другую модель, которую мы когда-либо оценивали.