在單一 H200 上訓練了 800k 參數,持續 2 小時 30 分鐘