Một phòng thí nghiệm AI Trung Quốc vừa âm thầm phát hành một mô hình tự cải thiện 30% 🤯 Đội ngũ @MiniMax_AI đã cho M2.7 quyền truy cập vào cơ sở hạ tầng đào tạo của chính nó. Quy trình học tăng cường của chính nó. Bộ nhớ của chính nó. Sau đó, họ bảo nó tự cải thiện. Và nó đã làm được... M2.7 đã xây dựng hàng chục kỹ năng phức tạp bên trong bộ khung RL của nó. Nó đã cập nhật các hệ thống bộ nhớ của chính nó. Nó đã tối ưu hóa quy trình học tăng cường của chính nó dựa trên các kết quả mà nó đang đánh giá theo thời gian thực. Nó đã tự động chạy vòng lặp này hơn 100 lần, phân tích các quỹ đạo thất bại, sửa đổi mã khung của chính nó, thực hiện các đánh giá, so sánh kết quả và quyết định những gì nên giữ lại hoặc quay lại. Không có con người nào trong quy trình. Chỉ có mô hình cải thiện mô hình. Kết quả: - Cải thiện hiệu suất 30% trên các đánh giá nội bộ - Tỷ lệ huy chương 66.6% trong các cuộc thi ML (Điều này giúp nó ngang bằng với Gemini 3.1. Điểm SWE-Pro gần như tương đương với Claude Opus) MiniMax đã tự động vận hành 30% toàn bộ hoạt động của công ty trên các mô hình của chính nó. 80% mã mới được cam kết tại công ty là do AI tạo ra. Họ thực sự đang vận chuyển sự cải thiện tự động như một cơ sở hạ tầng tổ chức và thị trường chứng khoán Hồng Kông YÊU thích điều đó. Đây là giai đoạn đầu của sự tự cải thiện đệ quy. Và nó đến từ Thượng Hải.