Chińskie laboratorium AI właśnie cicho wydało model, który samodzielnie nauczył się poprawić o 30% 🤯 Zespół @MiniMax_AI dał M2.7 dostęp do własnej infrastruktury szkoleniowej. Własnego procesu uczenia przez wzmocnienie. Własnej pamięci. Następnie kazali mu uczynić się lepszym. I to zrobił... M2.7 zbudował dziesiątki złożonych umiejętności w swoim własnym systemie RL. Zaktualizował swoje systemy pamięci. Optymalizował swój proces uczenia przez wzmocnienie na podstawie wyników, które oceniał w czasie rzeczywistym. Prowadził tę pętlę autonomicznie przez ponad 100 rund, analizując trajektorie porażek, modyfikując swój własny kod szkieletowy, przeprowadzając oceny, porównując wyniki i decydując, co zachować lub co cofnąć. Nie było człowieka w pętli. Tylko model poprawiający model. Wynik: - 30% poprawy wydajności w wewnętrznych ocenach - 66,6% wskaźnik medali w konkursach ML (to łączy go z Gemini 3.1. Wyniki SWE-Pro są prawie równe Claude Opus) MiniMax już autonomicznie prowadzi 30% całej działalności firmy na swoich własnych modelach. 80% nowo wprowadzonego kodu w firmie jest generowane przez AI. Dosłownie wprowadzają samodoskonalenie jako infrastrukturę organizacyjną, a giełda w Hongkongu to uwielbia. To są wczesne etapy rekurencyjnego samodoskonalenia. I pochodzi z Szanghaju.