DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

De volgende paar video's zullen gaan over het finetunen van SLM's.❤️‍🔥 - Oorspronkelijk wilde ik een video van 60 minuten maken over modelontwikkeling na pretraining (CPT, Midtraining, SFT, RLHF, RLVR) - Maar dat zou maanden duren, dus in plaats daarvan maak ik een mini-serie van ~20 minuten video's. - Ononderbroken met wat HF en Pytorch waar nodig. Het RL-gedeelte zal Prime Labs gebruiken. - Afgezien van de code, zal de belangrijkste focus liggen op datasets. Het identificeren van OS-datasets, het voorbereiden ervan, het genereren van synthetische datasets voor training, enz. - Een ander belangrijk punt zal gaan over evaluatie. Het opzetten van harnassen voor metrics. - De onderwerpen van latere video's zijn nog niet volledig gepland, de screenshot is een basisroutekaart. Ik zal het afstemmen op basis van de vragen die ik van jullie krijg! - Ik zal zeker ook aan andere video's werken in de tussentijd. Als mijn gedachten afdwalen, laat ik het zo zijn. Maar ik hoop het binnen de komende 3 maanden af te ronden. Het hangt allemaal af van mijn plezier, wat er verder in de wereld gebeurt, en waar mijn publiek zich mee wil bezighouden. Dat gezegd hebbende, mijn volgende video zal 100% gaan over voortgezette pretraining op aangepaste datasets.

Boven

Positie

Favorieten