Pesos abertos não são treino aberto. @AddieF38654 da nossa equipe escreveu sobre sua experiência tentando pós-treinar um modelo MoE de 1T parâmetros usando a infraestrutura de código aberto existente. Vamos descobrir quantos monkey-patches são necessários para pós-treinar um modelo de pesos abertos. Um thread🧵