utilizzando @PrimeIntellect per l'intero nostro pipeline rl su glm 4.6v e finetune di sicurezza nemotron e amico, la mia convinzione non è mai stata così forte, è tutto così semplice prime-rl + verificatori + env hub + formazione ospitata (non la utilizzo perché ho crediti modal 😋 ma è fantastico) e puoi letteralmente addestrare i tuoi modelli su qualsiasi cosa e iniziare in meno di 15 minuti, se non più veloce.