usando @PrimeIntellect para todo nuestro pipeline rl en glm 4.6v y los ajustes de seguridad de nemotron y, hombre, mi convicción nunca ha sido tan fuerte, es tan sencillo prime-rl + verificadores + hub de entornos + entrenamiento alojado (no lo estoy usando porque tengo créditos de modal 😋 pero es genial) y literalmente puedes entrenar tus modelos en cualquier cosa y empezar en menos de 15 minutos, si no más rápido.