Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Stavební @EurekaLabsAI. Dříve ředitel AI @ Tesla, zakládající tým @ OpenAI, CS231n/PhD @ Stanford. Rád trénuji velké hluboké neuronové sítě.
Velmi mě zajímá, jak by mohla vypadat éra vysoce na míru šitého softwaru.
Příklad z dnešního rána – v poslední době jsem se trochu rozčiloval a byl jsem trochu nestabilní v kardio, tak jsem se rozhodl pro vážnější, pravidelný experiment, abych snížil klidový tep z 50 > 45 během trvání experimentu 8 týdnů. Hlavní způsob, jak toho dosáhnout, je usilovat o určitý celkový počet minutových cílů v kardio zóně 2 a 1 HIIT týdně.
O hodinu později jsem naprogramoval tento super vlastní dashboard pro tento velmi specifický experiment, který mi ukazuje, jak sleduji. Claude musel reverzně analyzovat cloudové API Woodway treadmill, aby stáhl surová data, zpracoval, filtroval, ladil a vytvořil webové rozhraní pro sledování experimentu. Nebyl to úplně plynulý zážitek a musel jsem si všímat a požádat o opravu chyb, například to pokazilo metrické a imperiální systémové jednotky a pokazilo to kalendář při párování dnů s daty atd.
Ale pořád mám pocit, že celkový směr je jasný:
1) Nikdy nebude (a neměla by být) konkrétní aplikace v obchodě s aplikacemi pro takové věci. Neměl bych muset hledat, stahovat a používat nějaký "kardio experiment tracker", když tohle je ~300 řádků kódu, které vám agent LLM dá během pár sekund. Myšlenka "obchodu s aplikacemi" s dlouhým ocasem samostatné sady aplikací, ze kterých si vybíráte, působí nějak špatně a zastarale, když agenti LLM mohou aplikaci improvizovat na místě a jen pro vás.
2) Za druhé, průmysl se musí přeorganizovat na sadu senzorů a akčních členů s nativní ergonomií agenta. Můj běžecký pás Woodway je senzor – proměňuje fyzický stav v digitální znalosti. Neměl by udržovat nějaký lidsky čitelný frontend a můj LLM agent by to neměl muset zpětně analyzovat, měl by to být API/CLI, které agent snadno využije. Jsem trochu zklamaný (a mé časové plány jsou odpovídajícím způsobem pomalejší) z toho, jak pomalu se tento vývoj v oboru odehrává. 99 % produktů/služeb stále nemá AI nativní CLI. 99 % produktů/služeb udržuje .html/.css dokumenty, takže hned nebudu hledat, jak vše zkopírovat a vlepit agentovi, abych něco udělal. Na webové stránce vám dají seznam instrukcí, jak otevřít tuto nebo onu URL a kliknout zde či tam, abyste něco udělali. V roce 2026. Co jsem já počítač? Udělej to ty. Nebo ať to udělá můj agent.
Každopádně dnes mě ohromilo, že tohle náhodné zařízení trvalo 1 hodinu (před dvěma lety by to bylo ~10 hodin). Ale co mě víc nadchne, je přemýšlet o tom, že to vlastně mělo být maximálně 1 minuta. Co musí být připraveno, aby to trvalo 1 minutu? Takže jsem mohl jednoduše říct: "Ahoj, můžeš mi pomoct sledovat kondici během příštích 8 týdnů?" a po velmi krátkém rozhovoru by aplikace byla otevřená. AI už měla hodně osobního kontextu, shromáždila by potřebná data, odkazovala a vyhledávala knihovny souvisejících dovedností a spravovala všechny mé malé aplikace/automatizace.
Stručně řečeno, "app store" složený z několika samostatných aplikací, ze kterých si vybíráte, je sám o sobě stále zastaralejší koncept. Budoucnost jsou služby nativních senzorů a aktuátorů AI orchestrovaných pomocí LLM lepidla do vysoce přizpůsobených, efemérních aplikací. Jen to ještě není.

103
Myslím, že to musí být velmi zajímavá doba pro programovací jazyky a formální metody, protože LLM úplně mění prostředí omezení softwaru. Náznaky toho jsou už patrné, například v rostoucím zájmu portování C do Rustu nebo rostoucím zájmu o upgrade starších kódů v COBOLu a podobně. Zejména jsou LLM *obzvlášť* dobré pro překlad ve srovnání s generací de-novo, protože 1) původní kódová základna slouží jako jakýsi vysoce detailní prompt a 2) jako reference pro psaní konkrétních testů ve vztahu na. To ale neznamená, že ani Rust není zdaleka ideální pro LLM jako cílový jazyk. Jaký typ jazyka je optimální? Jaké ústupky (pokud vůbec nějaké) jsou pro lidi stále vyčleněny? Neuvěřitelně zajímavé nové otázky a příležitosti. Zdá se pravděpodobné, že budeme muset přepsat velké části veškerého softwaru, který kdy byl napsán, mnohokrát.
101
Gratuluji k zahájení @simile_ai! (a těším se, že se mohu zapojit jako malý anděl.)
Simile pracuje na opravdu zajímavém, podle mého názoru málo prozkoumaném rozměru LLM. Obvykle mají LLM, se kterými mluvíte, jednu specifickou, propracovanou osobnost. Ale v zásadě je nativní, prvotní forma předtrénovaného LLM v tom, že jde o simulační engine trénovaný nad textem velmi rozmanité skupiny lidí na internetu. Proč se nezaměřit na tuto statistickou sílu: Proč simulovat jednu "osobu", když byste se mohli pokusit simulovat populaci? Jak se takový simulátor postaví? Jak zvládáte jeho entropii? Jak věrná je? Jak může být užitečný? Jaké emergentní vlastnosti by mohly vzniknout u přirovnání ve smyčkách?
Podle mě jsou to velmi zajímavá, slibná a málo prozkoumaná témata a tým je zde skvělý. Hodně štěstí!

Joon Sung Park13. 2. 03:00
Představujeme Simile.
Simulace lidského chování je jedním z nejzásadnějších a technicky nejnáročnějších problémů naší doby.
Získali jsme 100 milionů dolarů od Index, Hanabi, A* BCV @karpathy @drfeifei @adamdangelo @rauchg @scottbelsky a dalších.
92
Top
Hodnocení
Oblíbené
