Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Công khai, xAI chưa nói "chúng tôi đã đào tạo một mô hình thưởng mà ánh xạ dự thảo tweet -> lượt thích dự kiến." Nhưng họ rất rõ ràng là có những thành phần thô cần thiết. X nói rằng các bài đăng công khai, cộng với siêu dữ liệu như tương tác/đăng lại, có thể được chia sẻ với xAI để đào tạo/tinh chỉnh. Nó cũng nói rằng các tương tác, đầu vào, kết quả của bạn, và thậm chí phản hồi rõ ràng về Grok có thể được sử dụng để cải thiện các mô hình. Trong khi đó, Grok có quyền truy cập gốc vào dữ liệu X theo thời gian thực, và xAI đã nói rằng nó sử dụng RL quy mô lớn cho lý luận/sử dụng công cụ. Vì vậy, tôi đoán rằng nó không thực sự chỉ là một mô hình dự đoán lượt thích từ tweet dễ thương, mà là một cái gì đó phức tạp hơn và có lẽ mạnh mẽ hơn, điều xảy ra khi bạn tiền đào tạo trên diễn ngôn trực tuyến, học từ những gì lan truyền, thu thập phản hồi rõ ràng và ngầm, sau đó để các chỉ số sản phẩm hoàn tất vòng lặp. Không phải một mô hình thưởng duy nhất. Hơn giống như điều kiện hành vi toàn diện.

Hàng đầu

Thứ hạng

Yêu thích