Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Chciałem wprowadzić kilka wyjaśnień, które naszym zdaniem były jasne w naszym artykule, ale nie w moim oryginalnym poście (ponownie analizując dane @METR_Evals). Naszym wkładem jest postawienie tezy, że postęp jest iloczynem sigmoidalnym wokół różnych innowacji. Biorąc pod uwagę dane METR, dzielimy je na poprawy w podstawowych możliwościach (rozmiar danych/modelu) i rozumowaniu. Pokazujemy, że ten iloczyn zapewnia podobne dopasowanie *w próbie* do małych zbiorów danych, które obserwujemy, jak wzrost wykładniczy. Jednak implikacje są bardzo różne! Zgodnie z naszym modelem, potrzebowalibyśmy ciągłych innowacji (podobnych do rozumowania), aby zobaczyć dalszy postęp wykładniczy. To nie znaczy, że wykluczamy postęp wykładniczy, ani że nasz iloczyn sigmoidalny jest właściwym modelem. Chodzi po prostu o to, że istnieje kilka punktów i wiele możliwych modeli podstawowych z bardzo różnymi implikacjami. Nasz iloczyn dopasowania sigmoidalnego faktycznie dobrze pasuje, gdy wykluczamy GPT 5.2 i/lub Gemini 3 pro. Wypadamy gorzej, gdy dodatkowo wykluczamy Claude Opus 4.5, ale nadal jest to prawdopodobne. Naszym celem nie jest spór o metryki OOS na garstce punktów danych, ale zwrócenie uwagi, że istniejące prognozy są kruche i nie modelują sukcesji różnych innowacji. (Jest kilka innych dopasowań krążących po X, ale nie wydaje się, aby używały naszego proponowanego iloczynu sigmoidalnego, więc nie mogę powiedzieć, co się tam dzieje...) Przepraszam za mój wcześniejszy post bez niuansów – mamy nadzieję, że ludzie przeczytają artykuł!

Najlepsze

Ranking

Ulubione