Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Jeg ønsket å komme med noen presiseringer, som vi mener var tydelige i artikkelen vår, men ikke i mitt opprinnelige innlegg (reanalyse av @METR_Evals data).
Vårt bidrag er å postulere fremgang som et multiplikativt produkt av sigmoider rundt ulike innovasjoner. Gitt METR-dataene delte vi dem inn i forbedringer i grunnleggende kapasiteter (data-/modellstørrelse) og resonnement.
Vi viser at dette produktet gir en lignende *in-sample* tilpasning til de små datasettene vi observerer som eksponentiell vekst. Men implikasjonene er veldig forskjellige! Under vår modell ville vi trenge kontinuerlige innovasjoner (tilsvarende resonnement) for å se fortsatt eksponentiell fremgang.
Dette betyr ikke at vi utelukker eksponentiell fremgang, eller at vårt produkt av sigmoider er den riktige modellen. Det er enkelt og greit å si at det finnes få punkter og flere mulige underliggende modeller med svært forskjellige implikasjoner.
Produktet vårt Sigmoid passer faktisk veldig godt når man holder ut GPT 5.2 og/eller Gemini 3 Pro. Vi ser verre ut når vi i tillegg holder ut Claude Opus 4.5, men det er fortsatt plausibelt. Målet vårt er ikke å krangle om OOS-målinger på noen få datapunkter, men å påpeke at eksisterende prognoser er skjøre, og ikke modellerer rekkefølgen av ulike innovasjoner. (Det finnes et par andre tilpasninger rundt X, men de ser ikke ut til å bruke vårt foreslåtte produkt-sigmoid, så jeg kan ikke si hva som skjer der...)
Jeg beklager mitt lite nyanserte innlegg tidligere – vi håper folk vil lese artikkelen!
Topp
Rangering
Favoritter
