Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Следующие несколько видео будут о тонкой настройке SLM.❤️🔥
- Изначально я хотел сделать 60-минутное видео, охватывающее разработку модели после предварительного обучения (CPT, Midtraining, SFT, RLHF, RLVR)
- Но это заняло бы у меня месяцы, поэтому вместо этого я делаю мини-серию из ~20-минутных видео.
- Буду использовать Unsloth с некоторыми HF и Pytorch, где это необходимо. Часть по RL будет использовать Prime Labs.
- В стороне от кода, основное внимание будет уделено наборам данных.
идентификация OS наборов данных, их подготовка, генерация синтетических наборов данных для обучения и т.д.
- Еще одной важной темой будет оценка. Настройка систем для метрик.
- Темы будущих видео еще не полностью запланированы, скриншот - это базовая дорожная карта. Я буду действовать по ситуации в зависимости от вопросов, которые я получу от вас!
- Я определенно буду работать над другими видео между делом. Если мой ум будет блуждать, я это позволю. Но я надеюсь закончить это в течение следующих 3 месяцев или около того.
Все зависит от моего удовольствия, от того, что еще происходит в мире, и от того, с чем хочет взаимодействовать моя аудитория.
Сказав это, мое следующее видео будет на 100% о продолжении предварительного обучения на пользовательских наборах данных.

Топ
Рейтинг
Избранное
