DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Meera | AI Tools & News

🚨Andrej Karpathy vient de rendre open source un système qui automatise la recherche en IA pendant que vous dormez. Cela s'appelle autoresearch. J'ai passé du temps à explorer tout le dépôt pour que vous n'ayez pas à le faire. Voici comment cela fonctionne réellement : Vous donnez à un agent IA une petite configuration d'entraînement de modèle de langage. L'agent modifie le code. S'entraîne pendant exactement 5 minutes. Vérifie si le résultat s'est amélioré. Garde ou jette. Répète. Vous vous réveillez avec un journal complet des expériences et un meilleur modèle. Le dépôt entier se compose de 3 fichiers : → prepare.py gère la préparation des données et l'entraînement du tokenizer → train.py contient le modèle GPT complet et la boucle d'entraînement → program.md contient les instructions de l'agent L'agent ne touche qu'à train.py. C'est tout. Voici ce qui rend le design si intelligent : Chaque session d'entraînement est limitée à un budget de 5 minutes sur l'horloge. Pas d'étapes ou d'époques, mais le temps réel sur l'horloge. Cela signifie que chaque expérience est directement comparable, peu importe ce que l'agent change. Peu importe si l'agent change la taille du modèle, la taille du lot ou l'architecture entière. Vous avez 5 minutes et c'est tout. Il a réalisé 83 expériences tout seul. Seules 15 ont réellement amélioré le modèle. Cela représente un taux de réussite d'environ 18%. À peu près le même que celui d'un chercheur en ML humain essayant des choses manuellement. La métrique de score est val_bpb (bits de validation par octet). Elle ne dépend pas du choix du tokenizer ou de la taille du vocabulaire. C'est la seule façon équitable de comparer lorsque l'agent change d'architecture entre les sessions. Vous pouvez vous attendre à environ 12 expériences par heure. Environ 100 expériences pendant la nuit. Testé sur un seul NVIDIA H100 exécutant Python 3.10+ sous une licence MIT. Pas d'entraînement distribué et pas de configurations complexes. La seule dépendance est PyTorch. Karpathy l'a dit le mieux : "Un jour, la recherche en IA de pointe était réalisée par des ordinateurs biologiques entre manger, dormir, s'amuser et se synchroniser de temps en temps en utilisant des interconnexions par ondes sonores dans le rituel des réunions de groupe. Cette époque est révolue."

Meilleurs

Classement

Favoris