Vi bruker @PrimeIntellect for hele vår RL-pipeline på GLM 4.6V og Nemotron Security finetunes, og min overbevisning har aldri vært så sterk, det er bare så rett frem Prime-RL + verifikatorer + miljøhub + hostet trening (bruker ikke fordi jeg har modalkreditter 😋, men det er flott) og du kan bokstavelig talt trene modellene dine på hva som helst og bare komme i gang på under 15 minutter, om ikke raskere,