DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Meera | AI Tools & News

🚨Andrej Karpathy ha appena reso open source un sistema che automatizza la ricerca sull'IA mentre dormi. Si chiama autoresearch. Ho passato del tempo a esaminare l'intero repository così non devi farlo tu. Ecco come funziona realmente: Dai a un agente IA un piccolo setup di addestramento di un modello linguistico. L'agente modifica il codice. Si allena per esattamente 5 minuti. Controlla se il risultato è migliorato. Tiene o scarta. Ripete. Ti svegli con un log completo degli esperimenti e un modello migliore. L'intero repository è composto da 3 file: → prepare.py gestisce la preparazione dei dati e l'addestramento del tokenizer → train.py contiene il modello GPT completo e il ciclo di addestramento → program.md sono le istruzioni per l'agente L'agente tocca solo train.py. Questo è tutto. Ecco cosa rende il design così intelligente: Ogni singolo run di addestramento è bloccato a un budget di 5 minuti sul cronometro. Non passi o epoche, ma tempo reale sul cronometro. Questo significa che ogni esperimento è direttamente comparabile indipendentemente da ciò che cambia l'agente. Non importa se l'agente cambia la dimensione del modello, la dimensione del batch o l'intera architettura. Hai 5 minuti e basta. Ha eseguito 83 esperimenti da solo. Solo 15 hanno effettivamente migliorato il modello. Questo corrisponde a una percentuale di successo del 18%. Circa la stessa cosa di un ricercatore ML umano che prova manualmente. La metrica di scoring è val_bpb (bit di validazione per byte). Non dipende dalla scelta del tokenizer o dalla dimensione del vocabolario. Questo è l'unico modo equo per confrontare quando l'agente cambia architettura tra i run. Puoi aspettarti circa 12 esperimenti all'ora. Circa 100 esperimenti durante la notte. Testato su un singolo NVIDIA H100 che esegue Python 3.10+ sotto licenza MIT. Nessun addestramento distribuito e nessuna configurazione complessa. L'unica dipendenza è PyTorch. Karpathy l'ha messa meglio: "Un tempo la ricerca di frontiera sull'IA era svolta da computer di carne tra un pasto, un sonno, un po' di divertimento e sincronizzandosi di tanto in tanto usando onde sonore nel rituale della riunione di gruppo. Quell'era è ormai lontana."

Principali

Ranking

Preferiti