Chúng tôi đã huấn luyện Composer tự tóm tắt thông qua RL thay vì một lời nhắc. Điều này giảm lỗi từ việc nén xuống 50% và cho phép Composer thành công trong các nhiệm vụ lập trình khó khăn yêu cầu hàng trăm hành động.