أضفنا كلود-أوبوس-4.6 إلى MathArena! إنه نموذج قوي، لا يتجاوز Gemini-3.1-Pro في معظم اختبارات العرض. استثناء واحد: يحصل على درجات ضعيفة جدا في الرياضيات البصرية. أيضا، هو مكلف: أنفقنا حوالي 8,000 دولار لإضافة النموذج، أي 10 أضعاف أي نموذج آخر قمنا بتقييمه.