我們對許多基於困惑度的基準模型進行了評估,Kimi k2.5 被證明是最強的! 之後,我們進行了持續的預訓練和高計算的強化學習(4倍擴展)。 強大的基礎模型、CPT 和強化學習的結合,以及 Fireworks 的推理和強化學習取樣器,使 Composer-2 達到了前沿水平。 從一開始就沒有在我們的博客中提到 Kimi 基礎模型是個遺憾。我們會在下一個模型中修正這一點。