Следующие несколько видео будут о тонкой настройке SLM.❤️‍🔥 - Изначально я хотел сделать 60-минутное видео, охватывающее разработку модели после предварительного обучения (CPT, Midtraining, SFT, RLHF, RLVR) - Но это заняло бы у меня месяцы, поэтому вместо этого я делаю мини-серию из ~20-минутных видео. - Буду использовать Unsloth с некоторыми HF и Pytorch, где это необходимо. Часть по RL будет использовать Prime Labs. - В стороне от кода, основное внимание будет уделено наборам данных. идентификация OS наборов данных, их подготовка, генерация синтетических наборов данных для обучения и т.д. - Еще одной важной темой будет оценка. Настройка систем для метрик. - Темы будущих видео еще не полностью запланированы, скриншот - это базовая дорожная карта. Я буду действовать по ситуации в зависимости от вопросов, которые я получу от вас! - Я определенно буду работать над другими видео между делом. Если мой ум будет блуждать, я это позволю. Но я надеюсь закончить это в течение следующих 3 месяцев или около того. Все зависит от моего удовольствия, от того, что еще происходит в мире, и от того, с чем хочет взаимодействовать моя аудитория. Сказав это, мое следующее видео будет на 100% о продолжении предварительного обучения на пользовательских наборах данных.