Open gewichten is geen open training. @AddieF38654 van ons team heeft haar ervaring opgeschreven met het post-trainen van een 1T parameter MoE-model met behulp van de bestaande open source infrastructuur. Laten we ontdekken hoeveel monkey-patches nodig zijn om een open-gewichten model post-te trainen. Een thread🧵