DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Meera | AI Tools & News

🚨Andrej Karpathy heeft net een systeem open-source gemaakt dat AI-onderzoek automatiseert terwijl je slaapt. Het heet autoresearch. Ik heb tijd besteed aan het doorzoeken van de hele repo zodat jij dat niet hoeft te doen. Hier is hoe het eigenlijk werkt: Je geeft een AI-agent een kleine taalmodel trainingsopstelling. De agent past de code aan. Traint precies 5 minuten. Controleert of het resultaat beter is geworden. Houdt of verwerpt. Herhaalt. Je wordt wakker met een volledig logboek van experimenten en een beter model. De hele repo bestaat uit 3 bestanden: → prepare.py behandelt gegevensvoorbereiding en tokenizer training → train.py bevat het volledige GPT-model en de trainingslus → program.md zijn de instructies van de agent De agent raakt alleen train.py aan. Dat is het hele verhaal. Hier is wat het ontwerp zo slim maakt: Elke enkele trainingsronde is gebonden aan een budget van 5 minuten op de klok. Niet stappen of epochs, maar daadwerkelijke tijd op de klok. Dit betekent dat elk experiment direct vergelijkbaar is, ongeacht wat de agent verandert. Het maakt niet uit of de agent de modelgrootte, batchgrootte of de hele architectuur verwisselt. Je krijgt 5 minuten en dat is het. Het heeft 83 experimenten op zichzelf uitgevoerd. Slechts 15 hebben het model daadwerkelijk verbeterd. Dat is ongeveer een hitrate van 18%. Ongeveer hetzelfde als een menselijke ML-onderzoeker die dingen handmatig probeert. De scoremaatstaf is val_bpb (validatie bits per byte). Het hangt niet af van de keuze van de tokenizer of de vocabulairegrootte. Dat is de enige eerlijke manier om te vergelijken wanneer de agent de architectuur tussen de runs verandert. Je kunt ongeveer 12 experimenten per uur verwachten. Ongeveer 100 experimenten 's nachts. Getest op een enkele NVIDIA H100 die Python 3.10+ draait onder een MIT-licentie. Geen gedistribueerde training en geen complexe configuraties. De enige afhankelijkheid is PyTorch. Karpathy verwoordde het het beste: "Op een dag werd grensverleggend AI-onderzoek gedaan door vleescomputers tussen het eten, slapen, plezier hebben en af en toe synchroniseren met behulp van geluidsgolven in de ritueel van groepsvergaderingen. Die tijd is lang voorbij."

Boven

Positie

Favorieten