Un laboratorio de IA chino acaba de lanzar silenciosamente un modelo que se entrenó a sí mismo para mejorar en un 30% 🤯 El equipo de @MiniMax_AI le dio a M2.7 acceso a su propia infraestructura de entrenamiento. Su propio pipeline de aprendizaje por refuerzo. Su propia memoria. Luego le dijeron que se mejorara a sí mismo. Y lo hizo... M2.7 construyó docenas de habilidades complejas dentro de su propio arnés de RL. Actualizó sus propios sistemas de memoria. Optimizó su propio proceso de aprendizaje por refuerzo basado en los resultados que estaba evaluando en tiempo real. Ejecutó este ciclo de forma autónoma durante más de 100 rondas, analizando trayectorias de fallos, modificando su propio código de andamiaje, realizando evaluaciones, comparando resultados y decidiendo qué conservar o revertir. Ningún humano en el bucle. Solo el modelo mejorando el modelo. El resultado: - 30% de mejora en el rendimiento en evaluaciones internas - 66.6% de tasa de medallas en competiciones de ML (Esto lo empata con Gemini 3.1. Las puntuaciones de SWE-Pro mientras casi iguala a Claude Opus) MiniMax ya ejecuta el 30% de toda su operación empresarial de forma autónoma con sus propios modelos. El 80% del código recién comprometido en la empresa es generado por IA. Literalmente están enviando la auto-mejora como infraestructura organizacional y a la bolsa de valores de Hong Kong LE ENCANTA. Esta es la etapa temprana de la auto-mejora recursiva. Y viene de Shanghái.