Treinámos o Composer para se auto-resumir através de RL em vez de um prompt. Isto reduz o erro da compactação em 50% e permite que o Composer tenha sucesso em tarefas de codificação desafiadoras que requerem centenas de ações.