Китайська лабораторія штучного інтелекту щойно тихо випустила модель, яка навчилася покращуватися на 30 🤯% Команда @MiniMax_AI надала M2.7 доступ до власної навчальної інфраструктури. Власний конвеєр навчання з підкріпленням. Власна пам'ять. Потім вони сказали їй стати кращим. І це сталося... M2.7 створив десятки складних навичок у власній RL-системі. Він оновив власні системи пам'яті. Він оптимізував власний процес навчання за допомогою підкріплення на основі результатів, які оцінював у реальному часі. Він виконував цей цикл автономно понад 100 раундів, аналізуючи траєкторії відмов, змінюючи власний код каркасування, виконуючи оцінки, порівнюючи результати та вирішуючи, що залишити, а що скасувати. Жодної людини в колі. Просто модель покращує модель. Результат: - Покращення продуктивності на 30% під час внутрішніх оцінок - 66,6% відсоток медалей на змаганнях ML (це зрівняється з Gemini 3.1). SWE-Pro набирає бали, майже зрівнявшись із Клодом Опусом) MiniMax вже автономно керує 30% усіх операцій компанії на власних моделях. 80% новоствореного коду в компанії генерується штучним інтелектом. Вони буквально пропонують самовдосконалення як організаційну інфраструктуру, і фондовий ринок Гонконгу ДУЖЕ це обожнює. Це початкові етапи рекурсивного самовдосконалення. І це з Шанхаю.