DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Quería hacer algunas aclaraciones, que creemos que eran claras en nuestro documento pero no en mi publicación original (reanalizando los datos de @METR_Evals). Nuestra contribución es postular el progreso como un producto multiplicativo de sigmoides en torno a diferentes innovaciones. Dado los datos de METR, los dividimos en mejoras en capacidades básicas (tamaño de datos/modelo) y razonamiento. Mostramos que este producto proporciona un ajuste *in-sample* similar a los pequeños conjuntos de datos que observamos como crecimiento exponencial. Sin embargo, ¡las implicaciones son muy diferentes! Bajo nuestro modelo, necesitaríamos innovaciones continuas (similares al razonamiento) para ver un progreso exponencial continuo. Esto no quiere decir que descartemos el progreso exponencial, o que nuestro producto de sigmoides sea el modelo correcto. Simplemente queremos decir que hay pocos puntos y múltiples modelos subyacentes posibles con implicaciones muy diferentes. Nuestro ajuste de sigmoide del producto en realidad se ajusta muy bien al dejar fuera GPT 5.2 y/o Gemini 3 pro. Nos vemos peor al dejar fuera adicionalmente Claude Opus 4.5, pero sigue siendo plausible. Nuestro objetivo no es discutir sobre métricas OOS en un puñado de puntos de datos, sino señalar que las previsiones existentes son frágiles y no modelan la sucesión de diferentes innovaciones. (Hay un par de otros ajustes flotando por X, pero no parecen estar usando nuestro propuesto producto sigmoide, así que no puedo decir qué está pasando allí...) Pido disculpas por mi publicación anterior poco matizada; ¡esperamos que la gente lea el documento!

Parte superior

Clasificación

Favoritos