We hebben Composer getraind om zichzelf samen te vatten via RL in plaats van een prompt. Dit vermindert de fout door compressie met 50% en stelt Composer in staat om te slagen in uitdagende coderingstaken die honderden acties vereisen.