Čínská AI laboratoř právě tiše zveřejnila model, který se trénoval k zlepšení o 30 % 🤯 Tým @MiniMax_AI poskytl M2.7 přístup k vlastní výcvikové infrafrastruktuře. Vlastní proces posilovaného učení. Vlastní paměť. Pak mu řekli, aby se zlepšil. A opravdu se to stalo... M2.7 vybudoval desítky složitých dovedností ve svém vlastním RL postroji. Aktualizovala své vlastní paměťové systémy. Optimalizoval svůj vlastní proces posilovaného učení na základě výsledků, které vyhodnocoval v reálném čase. Tento cyklus běžel autonomně více než 100 kol, analyzoval trajektorie selhání, upravoval vlastní scaffold kód, prováděl hodnocení, porovnával výsledky a rozhodoval, co zachovat nebo vrátit. Žádný člověk v tom. Jen model, který model vylepšuje. Výsledek: - 30% zlepšení výkonu interních hodnocení - 66,6% medailová míra na soutěžích ML (to je srovnává s Gemini 3,1. SWE-Pro skóre téměř odpovídá Claudu Opusovi) MiniMax již provozuje 30 % všech operací své společnosti autonomně na vlastních modelech. 80 % nově zavázaného kódu ve firmě je generováno AI. Doslova propagují seberozvoj jako organizační infrastrukturu a akciový trh Honk Kong to MILUJE. To jsou rané fáze rekurzivního sebezdokonalování. A přichází ze Šanghaje.