DApp Store | Web3 Hub for hendelser og spill

Populære emner

Jeg ønsket å komme med noen presiseringer, som vi mener var tydelige i artikkelen vår, men ikke i mitt opprinnelige innlegg (reanalyse av @METR_Evals data). Vårt bidrag er å postulere fremgang som et multiplikativt produkt av sigmoider rundt ulike innovasjoner. Gitt METR-dataene delte vi dem inn i forbedringer i grunnleggende kapasiteter (data-/modellstørrelse) og resonnement. Vi viser at dette produktet gir en lignende *in-sample* tilpasning til de små datasettene vi observerer som eksponentiell vekst. Men implikasjonene er veldig forskjellige! Under vår modell ville vi trenge kontinuerlige innovasjoner (tilsvarende resonnement) for å se fortsatt eksponentiell fremgang. Dette betyr ikke at vi utelukker eksponentiell fremgang, eller at vårt produkt av sigmoider er den riktige modellen. Det er enkelt og greit å si at det finnes få punkter og flere mulige underliggende modeller med svært forskjellige implikasjoner. Produktet vårt Sigmoid passer faktisk veldig godt når man holder ut GPT 5.2 og/eller Gemini 3 Pro. Vi ser verre ut når vi i tillegg holder ut Claude Opus 4.5, men det er fortsatt plausibelt. Målet vårt er ikke å krangle om OOS-målinger på noen få datapunkter, men å påpeke at eksisterende prognoser er skjøre, og ikke modellerer rekkefølgen av ulike innovasjoner. (Det finnes et par andre tilpasninger rundt X, men de ser ikke ut til å bruke vårt foreslåtte produkt-sigmoid, så jeg kan ikke si hva som skjer der...) Jeg beklager mitt lite nyanserte innlegg tidligere – vi håper folk vil lese artikkelen!

Topp

Rangering

Favoritter