Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Lebih banyak bukti LLM tidak sadar dan tidak menggeneralisasi informasi apa pun, dan oleh karena itu tidak akan menjadi cerdas secara umum, tetapi sebenarnya (masih sangat berguna) responden statistik terlatih.

19 Mar, 22.14
🚨 Mengejutkan: LLM Frontier mendapat skor 85-95% pada tolok ukur pengkodean standar. Kami memberi mereka masalah yang setara dalam bahasa yang tidak dapat mereka hafal. Mereka runtuh menjadi 0-11%.
Menghadirkan EsoLang-Bench.
Diterima di lokakarya Penalaran Logis dan ICBINB di ICLR 2026 🧵
Lulusan Compsci diberi tantangan pengkodean dalam bahasa yang belum pernah mereka lihat sebelumnya + dengan hanya sedikit sintaks dan diminta untuk melakukan hal-hal seperti membuat kode urutan Fibonacci untuk membuktikan bahwa mereka tidak hanya mengulangi beo, sepanjang waktu
Dan itu memang menyaring orang, tetapi tidak 90%
64
Teratas
Peringkat
Favorit
