Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Meera | AI Tools & News

🚨Andrej Karpathy vừa mã nguồn mở một hệ thống tự động hóa nghiên cứu AI trong khi bạn ngủ. Nó được gọi là autoresearch. Tôi đã dành thời gian để tìm hiểu toàn bộ repo để bạn không phải làm điều đó. Dưới đây là cách nó thực sự hoạt động: Bạn cung cấp cho một tác nhân AI một thiết lập huấn luyện mô hình ngôn ngữ nhỏ. Tác nhân sẽ sửa đổi mã. Huấn luyện trong đúng 5 phút. Kiểm tra xem kết quả có tốt hơn không. Giữ lại hoặc loại bỏ. Lặp lại. Bạn sẽ thức dậy với một bản ghi đầy đủ các thí nghiệm và một mô hình tốt hơn. Toàn bộ repo chỉ có 3 tệp: → prepare.py xử lý chuẩn bị dữ liệu và huấn luyện tokenizer → train.py có mô hình GPT đầy đủ và vòng lặp huấn luyện → program.md là hướng dẫn của tác nhân Tác nhân chỉ chạm vào train.py. Đó là toàn bộ. Dưới đây là điều làm cho thiết kế trở nên thông minh: Mỗi lần huấn luyện đều bị giới hạn trong ngân sách thời gian 5 phút. Không phải số bước hay số epoch mà là thời gian thực tế trên đồng hồ. Điều này có nghĩa là mỗi thí nghiệm đều có thể so sánh trực tiếp bất kể tác nhân thay đổi điều gì. Không quan trọng nếu tác nhân thay đổi kích thước mô hình hay kích thước lô hoặc toàn bộ kiến trúc. Bạn có 5 phút và chỉ có vậy. Nó đã tự chạy 83 thí nghiệm. Chỉ có 15 thí nghiệm thực sự cải thiện mô hình. Đó là khoảng 18% tỷ lệ thành công. Khoảng tương đương với một nhà nghiên cứu ML con người thử nghiệm thủ công. Chỉ số đánh giá là val_bpb (số bit xác thực trên byte). Nó không phụ thuộc vào lựa chọn tokenizer hay kích thước từ vựng. Đó là cách duy nhất công bằng để so sánh khi tác nhân thay đổi kiến trúc giữa các lần chạy. Bạn có thể mong đợi khoảng 12 thí nghiệm mỗi giờ. Khoảng 100 thí nghiệm qua đêm. Được thử nghiệm trên một NVIDIA H100 duy nhất chạy Python 3.10+ dưới giấy phép MIT. Không có huấn luyện phân tán và không có cấu hình phức tạp. Sự phụ thuộc duy nhất là PyTorch. Karpathy đã nói rất đúng: "Một ngày nào đó, nghiên cứu AI tiên phong từng được thực hiện bởi những máy tính thịt giữa việc ăn uống, ngủ nghỉ, vui chơi và đồng bộ hóa thỉnh thoảng bằng cách sử dụng kết nối sóng âm trong nghi thức họp nhóm. Thời đại đó đã qua lâu rồi."

Hàng đầu

Thứ hạng

Yêu thích