sử dụng @PrimeIntellect cho toàn bộ quy trình rl của chúng tôi trên glm 4.6v và tinh chỉnh bảo mật nemotron và tôi chưa bao giờ có niềm tin mạnh mẽ như vậy, nó thật đơn giản prime-rl + xác minh viên + trung tâm môi trường + đào tạo được lưu trữ (không sử dụng vì tôi có tín dụng modal 😋 nhưng nó thật tuyệt) và bạn có thể thực sự đào tạo mô hình của mình trên bất cứ thứ gì và chỉ cần bắt đầu trong vòng chưa đầy 15 phút nếu không nhanh hơn.