Gerçek Kariyer genellikle ara adımlarda faydalı sinyalleri atıyor, ya da @karpathy deyimimle, "denetimi pipetten emmek" gibi. MiniMax M2.5, bunu token başına işlem ödülleriyle çözer. Sonuç olarak, kapalı kaynak maliyetinin en az 1/10'u sınır kodlama performansı elde edilir. @thealexker, bu mekanizmanın nasıl çalıştığını ve M2.5'in genel bilgi çalışmasında nasıl üstün olduğunu açıklıyor. Buradan okuyun: