We hebben veel basismodellen geëvalueerd op basis van perplexiteitsevaluaties en Kimi k2.5 bleek de sterkste te zijn! Daarna doen we voortgezette pre-training en high-compute RL (een 4x opschaling). De combinatie van de sterke basis, CPT en RL, en de inferentie- en RL-samplers van Fireworks maken Composer-2 grensverleggend. Het was een gemiste kans om de Kimi-basis vanaf het begin in onze blog niet te vermelden. We zullen dat voor het volgende model rechtzetten.