Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Membangun @EurekaLabsAI. Sebelumnya Direktur AI @ Tesla, tim pendiri @ OpenAI, CS231n/PhD @ Stanford. Saya suka melatih jaring saraf dalam yang besar.
Sangat tertarik dengan seperti apa era perangkat lunak yang sangat dipesan lebih dahulu yang akan datang.
Contoh dari pagi ini - Saya menjadi agak longgar dengan kardio saya baru-baru ini jadi saya memutuskan untuk melakukan eksperimen yang lebih srs, rejimen untuk mencoba menurunkan Detak Jantung Istirahat saya dari 50 -> 45, selama durasi percobaan 8 minggu. Cara utama untuk melakukan ini adalah dengan bercita-cita untuk jumlah total gol menit tertentu di kardio Zona 2 dan 1 HIIT / minggu.
1 jam kemudian saya mengkodekan dasbor super kustom ini untuk eksperimen yang sangat spesifik ini yang menunjukkan kepada saya bagaimana saya melacak. Claude harus merekayasa balik API cloud treadmill Woodway untuk menarik data mentah, memproses, memfilter, men-debugnya, dan membuat frontend UI web untuk melacak eksperimen. Itu bukan pengalaman yang sepenuhnya mulus dan saya harus memperhatikan dan meminta untuk memperbaiki bug misalnya itu mengacaukan unit metrik vs. sistem imperial dan mengacaukan kalender, mencocokkan hari dengan tanggal, dll.
Tapi saya masih merasa arah keseluruhannya jelas:
1) Tidak akan pernah ada (dan seharusnya tidak ada) aplikasi khusus di toko aplikasi untuk hal semacam ini. Saya seharusnya tidak perlu mencari, mengunduh, dan menggunakan semacam "Pelacak eksperimen kardio", ketika benda ini adalah ~300 baris kode yang akan diberikan agen LLM kepada Anda dalam hitungan detik. Ide "toko aplikasi" dari serangkaian aplikasi terpisah yang Anda pilih terasa salah dan ketinggalan zaman ketika agen LLM dapat mengimprovisasi aplikasi di tempat dan hanya untuk Anda.
2) Kedua, industri harus mengkonfigurasi ulang menjadi serangkaian layanan sensor dan aktuator dengan ergonomi asli agen. Treadmill Woodway saya adalah sensor - mengubah keadaan fisik menjadi pengetahuan digital. Seharusnya tidak memelihara beberapa frontend yang dapat dibaca manusia dan agen LLM saya seharusnya tidak perlu merekayasa baliknya, itu harus menjadi API/CLI yang mudah digunakan oleh agen saya. Saya sedikit kecewa (dan garis waktu saya lebih lambat) dengan betapa lambatnya perkembangan ini terjadi di industri secara keseluruhan. 99% produk/layanan masih belum memiliki CLI asli AI. 99% produk/layanan memelihara dokumen .html/.css seperti saya tidak akan segera mencari cara menyalin, menempelkan semuanya, ke agen saya untuk menyelesaikan sesuatu. Mereka memberi Anda daftar instruksi di halaman web untuk membuka url ini atau itu dan klik di sini atau di sana untuk melakukan sesuatu. Pada tahun 2026. Apa itu komputer? Anda melakukannya. Atau minta agen saya melakukannya.
Jadi bagaimanapun hari ini saya terkesan bahwa hal acak ini memakan waktu 1 jam (itu akan ~ 10 jam 2 tahun yang lalu). Tapi yang lebih menggairahkan saya adalah memikirkan bagaimana ini seharusnya menjadi puncak 1 menit. Apa yang harus ada agar 1 menit? Sehingga saya bisa mengatakan "Hai, bisakah Anda membantu saya melacak kardio saya selama 8 minggu ke depan", dan setelah Tanya Jawab yang sangat singkat, aplikasi akan aktif. AI sudah memiliki banyak konteks pribadi, akan mengumpulkan data ekstra yang dibutuhkan, akan mereferensikan dan mencari perpustakaan keterampilan terkait, dan memelihara semua aplikasi/otomatisasi kecil saya.
TLDR, "toko aplikasi" dari serangkaian aplikasi terpisah yang Anda pilih, adalah konsep yang semakin ketinggalan zaman. Masa depan adalah layanan sensor & aktuator asli AI yang diatur melalui lem LLM menjadi aplikasi yang sangat khusus dan sementara. Hanya saja belum ada di sini.

104
Saya pikir ini pasti waktu yang sangat menarik untuk berada dalam bahasa pemrograman dan metode formal karena LLM mengubah seluruh lanskap kendala perangkat lunak sepenuhnya. Petunjuk tentang hal ini sudah dapat dilihat, misalnya dalam momentum yang meningkat di balik porting C ke Rust atau meningkatnya minat untuk meningkatkan basis kode lama di COBOL atau dll. Secara khusus, LLM *terutama* baik dalam terjemahan dibandingkan dengan generasi de-novo karena 1) basis kode asli bertindak sebagai semacam prompt yang sangat rinci, dan 2) sebagai referensi untuk menulis tes konkret sehubungan dengan. Meskipun demikian, bahkan Rust tidak optimal untuk LLM sebagai bahasa target. Bahasa seperti apa yang optimal? Konsesi apa (jika ada) yang masih diukir untuk manusia? Pertanyaan dan peluang baru yang sangat menarik. Rasanya mungkin kita akan menulis ulang sebagian besar dari semua perangkat lunak yang pernah ditulis berkali-kali.
102
Selamat atas peluncuran @simile_ai ! (dan saya senang terlibat sebagai malaikat kecil.)
Simile sedang mengerjakan dimensi LLM yang sangat menarik, imo yang kurang dieksplorasi. Biasanya, LLM yang Anda ajak bicara memiliki kepribadian tunggal yang spesifik dan dibuat. Tetapi pada prinsipnya, bentuk asli dan primordial dari LLM yang telah dilatih sebelumnya adalah bahwa itu adalah mesin simulasi yang dilatih atas teks populasi orang yang sangat beragam di internet. Mengapa tidak bersandar pada kekuatan statistik itu: Mengapa mensimulasikan satu "orang" ketika Anda dapat mencoba mensimulasikan populasi? Bagaimana Anda membangun simulator seperti itu? Bagaimana Anda mengelola entropinya? Seberapa setia itu? Bagaimana itu bisa berguna? Sifat apa yang muncul dari perumpamaan dalam loop?
Imo ini adalah topik yang sangat menarik, menjanjikan, dan kurang dieksplorasi dan tim di sini hebat. Semua yang terbaik!

Joon Sung Park13 Feb, 03.00
Memperkenalkan Simile.
Mensimulasikan perilaku manusia adalah salah satu masalah yang paling konsekuensial dan sulit secara teknis di zaman kita.
Kami mengumpulkan $100 juta dari Index, Hanabi, A* BCV, @karpathy @drfeifei @adamdangelo @rauchg @scottbelsky antara lain.
94
Teratas
Peringkat
Favorit
