Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Rakennus @EurekaLabsAI. Aiemmin AI @ Teslan johtaja, perustajatiimi @ OpenAI, CS231n/PhD @ Stanford. Tykkään treenata suuria syviä hermoverkkoja.
Olen erittäin kiinnostunut siitä, miltä tuleva erittäin räätälöityjen ohjelmistojen aikakausi voisi näyttää.
Esimerkki tältä aamulta – olen viime aikoina ollut hieman rento, hermostunut aerobisen liikunnan kanssa, joten päätin tehdä enemmän SRS-rutiininomaisen kokeen yrittääkseni laskea leposykkeeni 50:stä > 45:een, yli 8 viikon kokeilun ajan. Ensisijainen tapa tähän on pyrkiä tiettyyn kokonaisminuuttitavoitteeseen vyöhykkeellä 2 kardiotreenillä ja 1 HIIT:llä viikossa.
Tunnin kuluttua vibe-koodasin tämän superräätälöidyn dashboardin tätä hyvin tarkkaa kokeilua varten, joka näyttää minulle, miten seuraan. Claude joutui käänteisesti suunnittelemaan Woodwayn juoksumaton pilvirajapintaa raakadatan hakemiseksi, käsittelemiseksi, suodattamiseksi, virheenkorjaamisessa ja web-käyttöliittymän luomiseksi kokeen seuraamiseksi. Se ei ollut täysin sujuva kokemus, ja jouduin huomaamaan ja pyytämään korjauksia bugeista, esimerkiksi se sotki metriset ja imperiaaliset järjestelmäyksiköt sekä kalenterin päivien ja päivämäärien sovittamisen jne.
Mutta silti tuntuu, että kokonaissuunta on selvä:
1) App Storessa ei koskaan ole (eikä pitäisi olla) erityistä sovellusta tällaiseen tarkoitukseen. Minun ei pitäisi joutua etsimään, lataamaan ja käyttämään jonkinlaista "Cardio experiment trackeria", kun tämä laite on ~300 koodiriviä, jonka LLM-agentti antaa sinulle sekunneissa. Ajatus "sovelluskaupasta", jossa on pitkä joukko erillisiä sovelluksia, joista valitaan, tuntuu jotenkin väärältä ja vanhentuneelta, kun LLM-agentit voivat improvisoida sovelluksen paikan päällä ja juuri sinua varten.
2) Toiseksi alan täytyy konfiguroida uudelleen joukkoon antureita ja toimilaitteita, joissa on agentin alkuperäinen ergonomia. Woodway-juoksumattoni on anturi – se muuttaa fyysisen tilan digitaaliseksi tiedoksi. Sen ei pitäisi ylläpitää ihmisen luettavaa käyttöliittymää, eikä LLM-agentin pitäisi joutua purkamaan sitä, vaan sen pitäisi olla API/CLI, jota agentini voi helposti käyttää. Olen hieman pettynyt (ja aikatauluni ovat vastaavasti hitaampia) siihen, kuinka hitaasti tämä kehitys etenee alalla kokonaisuudessaan. 99 % tuotteista/palveluista ei vieläkään omaa tekoälypohjaista komentoyhteyttä. 99 % tuotteista/palveluista ylläpitää .html/.css-dokumentaatioita, en heti etsi keinoa kopioida ja liittää koko asia agentilleni, jotta saisin jotain tehtyä. He antavat sinulle ohjeet verkkosivulla avataksesi tämän tai tuon url:n ja klikkaamaan tästä tai tuosta tehdäksesi jotain. Vuonna 2026. Mikä minä olenko tietokone? Sinä teet sen. Tai anna agenttini tehdä sen.
Joka tapauksessa tänään olen vaikuttunut siitä, että tämä satunnainen juttu vei tunnin (kaksi vuotta sitten se olisi ollut ~10 tuntia). Mutta mikä minua innostaa enemmän, on miettiä, miten tämän olisi pitänyt kestää korkeintaan minuutti. Mitä pitää olla paikoillaan, jotta se kestäisi minuutin? Jotta voisin yksinkertaisesti sanoa "Hei, voisitko auttaa minua seuraamaan kardiota seuraavien 8 viikon aikana", ja hyvin lyhyen Q&A:n jälkeen sovellus olisi julkaistu. Tekoälyllä olisi jo paljon henkilökohtaista kontekstia, se keräisi ylimääräisen tarvittavan datan, viittaisi ja etsisi taitokirjastoja sekä ylläpitäisi kaikkia pieniä sovelluksiani/automaatioitani.
Yhteenvetona: "sovelluskauppa", joka koostuu erillisistä sovelluksista, joista valitset, on jo itsessään yhä vanhentuneempi käsite. Tulevaisuus on tekoälypohjaisten antureiden ja toimilaitteiden palvelut, jotka on orkestroitettu LLM-liimalla erittäin räätälöityiksi, katoavaisiksi sovelluksiksi. Se ei vain ole vielä täällä.

115
Mielestäni on varmasti hyvin mielenkiintoista aikaa olla ohjelmointikielten ja muodollisten menetelmien parissa, koska LLM:t muuttavat ohjelmistojen koko rajoitteiden kentän täysin. Vihjeitä tästä voi jo nähdä, esimerkiksi C:n siirtämisen Rustille kasvavassa vauhdissa tai kasvavassa kiinnostuksessa päivittää vanhoja koodipohjia COBOLissa jne. Erityisesti LLM:t ovat *erityisen* hyviä kääntämään verrattuna de-novo-generointiin, koska 1) alkuperäinen koodipohja toimii eräänlaisena erittäin yksityiskohtaisena kehotteena ja 2) viitteenä konkreettisten testien kirjoittamiseen liittyen. Siitä huolimatta edes Rust ei ole lähelläkään optimaalista LLM:ille kohdekieleksi. Millainen kieli on optimaalista? Mitä myönnytyksiä (jos ollenkaan) ihmisille vielä myönnetään? Uskomattoman mielenkiintoisia uusia kysymyksiä ja mahdollisuuksia. On todennäköistä, että päädymme kirjoittamaan suuria osia kaikesta koskaan kirjoitetusta ohjelmistosta uudelleen monta kertaa.
113
Onnittelut lanseerauksesta @simile_ai! (ja olen innoissani saadessani olla mukana pienenä enkelinä.)
Simile työskentelee todella mielenkiintoisen, mielestäni vähän tutkitun LLM-ulottuvuuden parissa. Yleensä LLM:illä, joiden kanssa puhut, on yksi erityinen, suunniteltu persoonallisuus. Mutta periaatteessa esikoulutetun LLM:n alkuperäinen, alkuperäinen muoto on simulaatiomoottori, joka on koulutettu hyvin monimuotoisen ihmisryhmän tekstien päälle internetissä. Miksi ei nojautuisi tähän tilastolliseen voimaan: Miksi simuloida yhtä "henkilöä", kun voisi yrittää simuloida populaatiota? Miten tällainen simulaattori rakennetaan? Miten hallitset sen entropiaa? Kuinka uskollinen se on? Miten siitä voi olla hyötyä? Mitä emergenttejä ominaisuuksia silmukoissa voisi syntyä vertauksista?
Mielestäni nämä ovat todella mielenkiintoisia, lupaavia ja vähän tutkittuja aiheita, ja tiimi täällä on loistava. Kaikkea hyvää!

Joon Sung Park13.2. klo 03.00
Esittelyssä Simile.
Ihmisen käyttäytymisen simulointi on yksi aikamme merkittävimmistä ja teknisesti vaikeimmista ongelmista.
Keräsimme 100 miljoonaa dollaria muun muassa Indexistä, Hanabista, A* BCV:stä @karpathy @drfeifei @adamdangelo @rauchg @scottbelsky.
104
Johtavat
Rankkaus
Suosikit
