het gebruik van @PrimeIntellect voor onze volledige rl-pijplijn op glm 4.6v en nemotron-beveiligingsfijnstellingen en man, mijn overtuiging is nog nooit zo sterk geweest, het is gewoon zo eenvoudig prime-rl + verifiers + env hub + gehoste training (niet gebruiken omdat ik modal credits heb 😋 maar het is geweldig) en je kunt letterlijk je modellen op alles trainen en gewoon binnen 15 minuten beginnen, zo niet sneller.