Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

#

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-0,67%

Boopa+7,92%

PORK0,00%

Joel Becker

Joel Becker18 mar, 10:28

ten wykres ożywia wewnętrzne mechanizmy horyzontu czasowego, co jest niesamowite. od mojego super utalentowanego kolegi @CFGeek.

200

Joel Becker11 mar, 01:34

nowe badanie @METR_Evals od @whitfill_parker, @cherylwoooo, nate rush i mnie. (głównie parker!) stwierdzamy, że *połowa* zweryfikowanych rozwiązań SWE-bench z generacji AI Sonnet 3.5-do-4.5 *które są oceniane jako zaliczone* jest odrzucana przez utrzymujących projekt.

106

Joel Becker9 mar, 02:06

Próbuję to zrobić w METR! Proszę, polub ten tweet lub wyślij mi DM, jeśli jesteś zainteresowany byciem respondentem.

Nate Silver6 mar, 09:33

Szczerze mówiąc, panel użytkowników o dużej mocy w stylu Consumer Reports może być lepszy niż METR itp. do mierzenia postępów AI, znacznie bardziej odporny na skoki. Nie chcę brzmieć sceptycznie, jako użytkownik o dużej mocy uważam, że w ciągu ostatnich kilku miesięcy nastąpił niezwykle zauważalny postęp, jeśli to coś znaczy.

203

Najlepsze

Ranking

Ulubione

Polski 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska Türkçe

Więcej o OKX Web3

Pobierz Akademia Informacje Kariera Kontakt Warunki świadczenia usługi Polityka prywatności X (dawniej Twitter)

Produkt

Panel portfela Zamiana (Swap)OKX NFT Earn Buduj Eksplorator Bezpieczeństwo

Wsparcie

Centrum wsparcia Oficjalna weryfikacja Ogłoszenia Harmonogram opłat DEX Połącz z OKX Portfel Bitcoin Portfel Ethereum Portfel Solana