Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Clădirea @EurekaLabsAI. Anterior Director AI @ Tesla, echipa fondatoare @ OpenAI, CS231n/PhD @ Stanford. Îmi place să antrenez rețele neuronale mari și profunde.
Sunt foarte interesat de cum ar putea arăta era viitoare a software-ului foarte personalizat.
Exemplu din această dimineață - am devenit puțin relaxat cu cardio-ul în ultima vreme, așa că am decis să fac un experiment mai mult SRS, regimentat, pentru a încerca să-mi reduc ritmul cardiac în repaus de la 50 la > 45, pe o durată de 8 săptămâni. Principalul mod de a face asta este să aspiri la un anumit număr total de obiective de minute în Zona 2 cardio și 1 HIIT/săptămână.
O oră mai târziu am creat un vibe code pentru un dashboard super personalizat pentru un experiment foarte specific care îmi arată cum urmăresc. Claude a trebuit să reverse engineering API-ul cloud al bandei de alergare Woodway pentru a extrage date brute, a procesa, a filtra, a le depana și a crea o interfață web UI pentru a urmări experimentul. Nu a fost o experiență complet lină și a trebuit să observ și să cer să repar bug-uri, de exemplu a stricat unitățile metrice față de cele din sistemul imperial și a greșit în calendar, potrivind zilele cu datele etc.
Dar tot simt că direcția generală este clară:
1) Nu va exista niciodată (și nici nu ar trebui să existe) o aplicație specifică în magazinul de aplicații pentru astfel de lucruri. Nu ar trebui să trebuiască să caut, să descarc și să folosesc un fel de "tracker de experimente cardio", când asta are ~300 de linii de cod pe care un agent LLM ți le va da în câteva secunde. Ideea unui "magazin de aplicații" cu un set lung de aplicații din care alegi pare cumva greșită și depășită, când agenții LLM pot improviza aplicația pe loc și doar pentru tine.
2) În al doilea rând, industria trebuie să se reconfigureze într-un set de servicii de senzori și actuatoare cu ergonomie native pentru agent. Banda mea de alergare Woodway este un senzor – transformă starea fizică în cunoaștere digitală. Nu ar trebui să mențină o interfață lizibilă de oameni și agentul meu LLM nu ar trebui să fie nevoit să o facă inginerie inversă, ar trebui să fie un API/CLI ușor de folosit de agentul meu. Sunt puțin dezamăgit (și termenele mele sunt corespunzător mai lente) de cât de lent este această progresie în industrie în ansamblu. 99% dintre produse/servicii încă nu au un CLI nativ AI. 99% dintre produse/servicii păstrează documentația .html/.css ca și cum nu aș căuta imediat cum să copiez și să lipesc totul agentului meu ca să rezolv ceva. Îți oferă o listă de instrucțiuni pe o pagină web pentru a deschide o anumită sau aceea URL și să dai click aici sau acolo pentru a face ceva. În 2026. Ce sunt eu, un calculator? Fă-o tu. Sau să o lase pe agentul meu să o facă.
Oricum, astăzi sunt impresionat că acest lucru întâmplător a durat o oră (ar fi fost ~10 ore acum 2 ani). Dar ceea ce mă entuziasmează mai mult este să mă gândesc cum ar fi trebuit să dureze maxim 1 minut. Ce trebuie să fie pus la punct astfel încât să dureze 1 minut? Ca să pot spune pur și simplu "Bună, mă poți ajuta să-mi monitorizez cardio-ul în următoarele 8 săptămâni", iar după o scurtă sesiune de întrebări și răspunsuri, aplicația era pornită. AI-ul ar avea deja mult context personal, ar aduna datele suplimentare necesare, ar face referire și ar căuta biblioteci de abilități legate de el și ar menține toate aplicațiile/automatizările mele.
Pe scurt, "magazinul de aplicații" al unui set de aplicații discrete din care alegi este un concept din ce în ce mai învechit de unul singur. Viitorul constă în servicii de senzori și actuatoare native AI, orchestrate prin lipici LLM în aplicații extrem de personalizate și efemere. Pur și simplu nu a sosit încă.

118
Cred că trebuie să fie o perioadă foarte interesantă pentru limbaje de programare și metode formale, pentru că LLM-urile schimbă complet peisajul constrângerilor software-ului. Indicii ale acestui lucru pot fi deja observate, de exemplu în impulsul tot mai mare pentru portarea C în Rust sau interesul tot mai mare pentru actualizarea bazelor de cod vechi în COBOL sau altele. În special, LLM-urile sunt *deosebit* bune la traducere comparativ cu generarea de-novo deoarece 1) baza originală de cod acționează ca un fel de prompt foarte detaliat și 2) ca referință pentru a scrie teste concrete în legătură cu acestea. Totuși, chiar și Rust nu este deloc optim pentru LLM-uri ca limbă țintă. Ce fel de limbaj este optim? Ce concesii (dacă există) mai sunt făcute pentru oameni? Întrebări și oportunități noi incredibil de interesante. Pare probabil că vom ajunge să rescriem de multe ori fracțiuni mari din tot software-ul scris vreodată.
116
Felicitări pentru lansare @simile_ai! (și sunt entuziasmată să fiu implicată ca un înger mic.)
Simile lucrează la o dimensiune foarte interesantă, din punctul meu de vedere subexplorată, a LLM-urilor. De obicei, LLM-urile cu care vorbești au o personalitate unică, specifică, construită. Dar, în principiu, forma nativă și primordială a unui LLM preantrenat este că este un motor de simulare antrenat peste textul unei populații extrem de diverse de oameni de pe internet. De ce să nu valorificăm această putere statistică: De ce să simulăm o singură "persoană" când ai putea încerca să simulezi o populație? Cum construiești un astfel de simulator? Cum îi gestionezi entropia? Cât de fidelă este? Cum poate fi util? Ce proprietăți emergente ar putea apărea din comparații în bucle?
Din punctul meu de vedere, acestea sunt subiecte foarte interesante, promițătoare și puțin explorate, iar echipa de aici este grozavă. Toate cele bune!

Joon Sung Park13 feb., 03:00
Vă prezentăm Simile.
Simularea comportamentului uman este una dintre cele mai importante și tehnic dificile probleme ale timpului nostru.
Am strâns 100 de milioane de dolari de la Index, Hanabi, A* BCV @karpathy @drfeifei @adamdangelo @rauchg @scottbelsky altele.
107
Limită superioară
Clasament
Favorite
