Ми оцінювали багато базових моделей на основі оцінок на основі перплексності, і Kimi k2.5 виявився найкращим! Після цього ми продовжуємо попереднє навчання та висококомп'ютерний RL (4-кратне масштабування). Поєднання сильної бази, CPT і RL, а також inference і RL-семплерів Fireworks робить Composer-2 на рівні фронтиру. Було помилкою не згадати базу Кімі в нашому блозі з самого початку. Виправимо це для наступної моделі.