我正在招聘專注於強化學習(RL)和分散式訓練基礎設施的研究工程師。 我們正在擴展1兆參數模型的強化學習。 我的私訊是開放的。