Los próximos vídeos tratarán sobre el ajuste fino de SLMs. ❤️ 🔥 - Originalmente quería un vídeo de 60 minutos cubriendo el desarrollo de modelos tras el preentrenamiento (CPT, Midtraining, SFT, RLHF, RLVR) - Pero eso me llevaría meses, así que en vez de eso estoy haciendo una miniserie de vídeos de ~20 minutos. - Pereza en todo el juego con algo de HF y Pytorch cuando sea necesario. La parte de la vida real usará Prime Labs. - Dejando el código a un lado, el enfoque principal serán los conjuntos de datos. identificar conjuntos de datos del sistema operativo, prepararlos, generar conjuntos sintéticos para entrenar, etc. - Otra carrera importante será sobre evaluación. Configurar arneses para métricas. - Los temas de los vídeos posteriores aún no están completamente planificados, la captura de pantalla es la hoja de ruta básica. ¡Voy a improvisar según las preguntas que me hagan! - Definitivamente trabajaré en otros vídeos entre medias. Si mi mente se dispersa, lo dejaré pasar. Pero espero terminarlo en los próximos 3 meses más o menos. Todo depende de mi disfrute, de lo que esté pasando en el mundo y de lo que mi audiencia quiera interactuar. Dicho esto, mi próximo vídeo tratará al 100% sobre el preentrenamiento continuo en conjuntos de datos personalizados.