Treinamos o Composer para se autoresumir via RL em vez de um prompt. Isso reduz o erro da compactação em 50% e permite que o Composer tenha sucesso em tarefas de codificação desafiadoras que exigem centenas de ações.