Estamos a abrir o código-fonte do WorldCompass, uma estrutura de pós-treinamento de RL especificamente projetada para Modelos de Mundo Interativos. 🛠️ Código de Treinamento Aberto: Totalmente personalizável para pós-treinamento com os seus próprios dados, recompensas ou modelos base. ⚡ Checkpoint de Código Aberto: Instruções mais precisas para seguir ações complexas e composicionais. O WorldCompass melhora significativamente o seguimento de ações composicionais e a interação de longo prazo no HY-World 1.5. 🕹️ Jogue agora: ⭐ GitHub: