Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Costruire @EurekaLabsAI. In precedenza Direttore di AI @ Tesla, team fondatore @ OpenAI, CS231n/PhD @ Stanford. Mi piace addestrare grandi reti neurali profonde.
Molto interessato a come potrebbe apparire l'era futura di software altamente personalizzati.
Esempio di questa mattina - sono diventato un po' troppo rilassato con il mio cardio recentemente, quindi ho deciso di fare un esperimento più serio e regimentato per cercare di abbassare la mia Frequenza Cardiaca a Riposo da 50 a 45, nel corso di 8 settimane. Il modo principale per farlo è aspirare a un certo obiettivo totale di minuti nella zona 2 di cardio e 1 HIIT/settimana.
Un'ora dopo ho creato questo super dashboard personalizzato per questo esperimento molto specifico che mi mostra come sto procedendo. Claude ha dovuto ingegnerizzare al contrario l'API cloud del tapis roulant Woodway per estrarre dati grezzi, elaborarli, filtrarli, debuggare e creare un'interfaccia web per monitorare l'esperimento. Non è stata un'esperienza completamente fluida e ho dovuto notare e chiedere di correggere bug, ad esempio ha confuso le unità del sistema metrico con quelle imperiali e ha avuto problemi a far combaciare i giorni con le date nel calendario, ecc.
Ma sento comunque che la direzione generale è chiara:
1) Non ci sarà mai (e non dovrebbe esserci) un'app specifica nello store per questo tipo di cosa. Non dovrei dover cercare, scaricare e usare un "tracker per esperimenti cardio", quando questa cosa è ~300 righe di codice che un agente LLM ti darà in pochi secondi. L'idea di uno "store di app" con un lungo elenco di app discrete tra cui scegliere sembra in qualche modo sbagliata e obsoleta quando gli agenti LLM possono improvvisare l'app sul posto e solo per te.
2) In secondo luogo, l'industria deve riconfigurarsi in un insieme di servizi di sensori e attuatori con ergonomia nativa per agenti. Il mio tapis roulant Woodway è un sensore - trasforma lo stato fisico in conoscenza digitale. Non dovrebbe mantenere un'interfaccia leggibile dall'uomo e il mio agente LLM non dovrebbe doverlo ingegnerizzare al contrario, dovrebbe essere un'API/CLI facilmente utilizzabile dal mio agente. Sono un po' deluso (e i miei tempi sono di conseguenza più lenti) da quanto lentamente stia avvenendo questa progressione nell'industria in generale. Il 99% dei prodotti/servizi non ha ancora un'API nativa per l'IA. Il 99% dei prodotti/servizi mantiene documenti .html/.css come se non cercassi immediatamente come copiare e incollare tutto per il mio agente per fare qualcosa. Ti danno un elenco di istruzioni su una pagina web per aprire questo o quel URL e cliccare qui o lì per fare una cosa. Nel 2026. Cosa sono, un computer? Fallo tu. O fai fare al mio agente.
Comunque, oggi sono impressionato che questa cosa casuale abbia preso 1 ora (sarebbero stati ~10 ore 2 anni fa). Ma ciò che mi entusiasma di più è pensare a come questo avrebbe dovuto richiedere al massimo 1 minuto. Cosa deve essere in atto affinché sia 1 minuto? Così che potrei semplicemente dire "Ciao, puoi aiutarmi a monitorare il mio cardio nelle prossime 8 settimane", e dopo una breve sessione di domande e risposte l'app sarebbe pronta. L'IA avrebbe già molto contesto personale, raccoglierebbe i dati extra necessari, farebbe riferimento e cercherebbe nelle librerie di abilità correlate e mantenerebbe tutte le mie piccole app/automazioni.
In sintesi, lo "store di app" di un insieme di app discrete tra cui scegliere è un concetto sempre più obsoleto di per sé. Il futuro sono servizi di sensori e attuatori nativi per l'IA orchestrati tramite LLM in app altamente personalizzate ed effimere. Non è ancora qui.

140
Penso che debba essere un periodo molto interessante per i linguaggi di programmazione e i metodi formali, poiché gli LLM cambiano completamente il panorama dei vincoli del software. Accenni a questo possono già essere visti, ad esempio, nel crescente slancio dietro il porting del C in Rust o nel crescente interesse per l'aggiornamento delle basi di codice legacy in COBOL, ecc. In particolare, gli LLM sono *soprattutto* bravi nella traduzione rispetto alla generazione de-novo perché 1) la base di codice originale funge da una sorta di prompt altamente dettagliato e 2) come riferimento per scrivere test concreti a riguardo. Detto ciò, anche Rust non è affatto ottimale per gli LLM come linguaggio di destinazione. Quale tipo di linguaggio è ottimale? Quali concessioni (se ce ne sono) sono ancora riservate agli esseri umani? Nuove domande e opportunità incredibilmente interessanti. Sembra probabile che finiremo per riscrivere grandi frazioni di tutto il software mai scritto molte volte.
138
Congratulazioni per il lancio @simile_ai ! (e sono entusiasta di essere coinvolto come un piccolo angel.)
Simile sta lavorando su una dimensione davvero interessante, secondo me poco esplorata, dei LLM. Di solito, i LLM con cui parli hanno una personalità unica, specifica e costruita. Ma in linea di principio, la forma nativa e primordiale di un LLM pre-addestrato è che è un motore di simulazione addestrato sui testi di una popolazione altamente diversificata di persone su internet. Perché non sfruttare quel potere statistico: perché simulare una "persona" quando potresti provare a simulare una popolazione? Come si costruisce un tale simulatore? Come si gestisce la sua entropia? Quanto è fedele? Come può essere utile? Quali proprietà emergenti potrebbero sorgere da simili in loop?
Secondo me, questi sono argomenti molto interessanti, promettenti e poco esplorati e il team qui è fantastico. Tutto il meglio!

Joon Sung Park13 feb, 03:00
Presentiamo Simile.
Simulare il comportamento umano è uno dei problemi più significativi e tecnicamente difficili del nostro tempo.
Abbiamo raccolto 100 milioni di dollari da Index, Hanabi, A* BCV, @karpathy @drfeifei @adamdangelo @rauchg @scottbelsky tra gli altri.
132
Principali
Ranking
Preferiti
