DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Ich wollte ein paar Klarstellungen machen, die wir in unserem Papier für klar hielten, aber nicht in meinem ursprünglichen Beitrag (erneute Analyse der Daten von @METR_Evals). Unser Beitrag besteht darin, Fortschritt als ein multiplikatives Produkt von Sigmoiden um verschiedene Innovationen zu postulieren. Angesichts der METR-Daten haben wir diese in Verbesserungen der Grundfähigkeiten (Daten-/Modellgröße) und des Denkens unterteilt. Wir zeigen, dass dieses Produkt eine ähnliche *In-Sample*-Anpassung an die kleinen Datensätze, die wir beobachten, wie exponentielles Wachstum bietet. Die Implikationen sind jedoch sehr unterschiedlich! Nach unserem Modell bräuchten wir fortlaufende Innovationen (ähnlich wie beim Denken), um weiterhin exponentiellen Fortschritt zu sehen. Das soll nicht heißen, dass wir exponentiellen Fortschritt ausschließen oder dass unser Produkt von Sigmoiden das richtige Modell ist. Es soll einfach sagen, dass es wenige Punkte und mehrere mögliche zugrunde liegende Modelle mit sehr unterschiedlichen Implikationen gibt. Unsere Produkt-Sigmoid-Anpassung passt tatsächlich sehr gut, wenn wir GPT 5.2 und/oder Gemini 3 pro zurückhalten. Wir sehen schlechter aus, wenn wir zusätzlich Claude Opus 4.5 zurückhalten, aber es bleibt plausibel. Unser Ziel ist es nicht, über OOS-Metriken bei einer Handvoll von Datenpunkten zu streiten, sondern darauf hinzuweisen, dass bestehende Prognosen fragil sind und die Abfolge verschiedener Innovationen nicht modellieren. (Es gibt ein paar andere Anpassungen, die auf X herumschwirren, aber sie scheinen unser vorgeschlagenes Produkt-Sigmoid nicht zu verwenden, also kann ich nicht sagen, was dort vor sich geht…) Ich entschuldige mich für meinen wenig nuancierten früheren Beitrag – wir hoffen, dass die Leute das Papier lesen werden!

Top

Ranking

Favoriten