DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Meera | AI Tools & News

🚨Andrej Karpathy baru saja membuka sumber sistem yang mengotomatiskan penelitian AI saat Anda tidur. Ini disebut penelitian otomatis. Saya menghabiskan waktu menggali seluruh repositori sehingga Anda tidak perlu melakukannya. Berikut cara kerjanya: Anda memberi agen AI pengaturan pelatihan model bahasa kecil. Agen memodifikasi kode. Kereta api tepat selama 5 menit. Memeriksa apakah hasilnya menjadi lebih baik. Menyimpan atau membuang. Berulang. Anda bangun dengan log penuh eksperimen dan model yang lebih baik. Seluruh repositori adalah 3 file: → mempersiapkan. PY menangani persiapan data dan pelatihan tokenizer →Latih. py memiliki model GPT lengkap dan loop pelatihan →program.md instruksi agen Agen hanya menyentuh kereta. py. Itu semuanya. Inilah yang membuat desainnya begitu cerdas: Setiap latihan dikunci pada anggaran jam dinding 5 menit. Bukan langkah atau zaman tetapi waktu aktual pada jam. Ini berarti setiap eksperimen dapat dibandingkan secara langsung tidak peduli apa yang diubah agennya. Tidak masalah jika agen menukar ukuran model atau ukuran batch atau seluruh arsitektur. Anda mendapatkan 5 menit dan hanya itu. Itu menjalankan 83 eksperimen sendiri. Hanya 15 yang benar-benar meningkatkan model. Itu sekitar 18% hit rate. Kira-kira sama dengan peneliti ML manusia yang mencoba sesuatu secara manual. Metrik penilaian adalah val_bpb (bit validasi per byte). Itu tidak tergantung pada pilihan tokenizer atau ukuran kosakata . Itulah satu-satunya cara yang adil untuk membandingkan ketika agen mengubah arsitektur di antara eksekusi. Anda dapat mengharapkan sekitar 12 eksperimen per jam. Sekitar 100 percobaan dalam semalam. Diuji pada satu NVIDIA H100 yang menjalankan Python 3.10+ di bawah lisensi MIT. Tidak ada pelatihan terdistribusi dan tidak ada konfigurasi yang rumit. Satu-satunya dependensi adalah PyTorch. Karpathy mengatakannya dengan baik: "Suatu hari penelitian AI perbatasan dulu dilakukan oleh komputer daging di antara makan, tidur, bersenang-senang, dan sinkronisasi sesekali menggunakan interkoneksi gelombang suara dalam ritual pertemuan kelompok. Era itu sudah lama berlalu."

Teratas

Peringkat

Favorit