Невероятно! @Kimi_Moonshot 2.5 Thinking разрывает задачи Олимпиады по математике одну за другой. P1 и P2 за 6-8 минут. P6 после двух попыток.
Codex 5.2-xhigh и Gemini 3 Pro все еще не справились с P6. Codex потратил 54 минуты на P1. Gemini справился за 5.
Для сравнения, предыдущие запуски ⬇️