Chez @covenant_ai, nous avons rendu l'apprentissage par renforcement décentralisé pour les LLM aussi rapide que l'apprentissage par renforcement centralisé. Nous réalisons une réduction de bande passante de plus de 100× pour la synchronisation des poids. Complètement sans perte. Voici comment nous l'avons fait ! (1/n)