Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 SON VERİCİ: Meta araştırmacıları bir modele 2 milyon saatlik video gösterdi. Etiket yok. Fizik ders kitabı yok. Hiç denetim yok.
Sonra bir nesnenin duvarın arkasına kaybolduğu ve bir daha geri dönmediği bir klip gösterildi.
Model yanlış olarak işaretledi. 🤯
Nesne kalıcılığını öğrenmişti. Şekil tutarlılığı. Çarpışma dinamikleri. Tamamen izlemekten.
Daha da şaşırtıcı olan: sadece bir haftalık benzersiz video üzerinde eğitilmiş bir model bile fizik ihlali tespitinde şansın üstünde performans sergiledi. Bu tesadüf değil. Bu bir ilke.
Makaleden alınan temel içgörüler: Bu sadece model öğrenilen bir temsil alanında tahmin ettiğinde işe yarıyor, ham piksellerde değil. Model, sıkıştırılmış ve soyut bir iç dünya modeli oluşturmalı ve buna karşı tahmin yapmalıdır. Piksel uzayı tahmini başarısız olur. Metin üzerinden akıl yürüten multimodal LLM'ler başarısız oluyor. Sadece soyut temsiller oluşturan ve eksik duyusal girdileri tahmin eden mimari, nörobilimcilerin öngörücü kodlamayı tanımlamasına benzeyen bir şey, fizik sezgisini gerçekten edinir.
Bu da araştırmacıların sabit programlanmış olduğunu düşündüğü temel bilginin ölçekli gözlem olabileceği anlamına geliyor. Bebekler nesnelerin kalıcılığını izleyerek öğrenirler. Meğerse aynı prensip burada da geçerli.
Şimdi kimsenin bahsetmediği kısım burada.
Eğer sadece gözlem bir modele fiziksel dünyanın kurallarını öğretiyorsa, aynı prensibi üretim sistemlerine uyguladığınızda ne olur?
Prodüksiyonda da fizik var.
Yerçekimi değil. Ama kurallar da aynı derecede tutarlı: hangi dağıtımlar saat 3'te olaylara yol açar, hangi yapılandırma kombinasyonları tehlikeli şekilde etkileşime girer, hangi kod yolları yük altında sessizce bozulur, hangi servis değişiklikleri iki sıçrama uzaklığında arızalara neden olur. Bu kalıplar binlerce yörüngede yer alıyor. Kod itmeleri, metrik vardiyalar, müşteri biletleri, olay zaman çizelgeleri. Büyük ölçüde gözlemlenmedi. Kesinlikle etiketsiz.
Kimse, "Servis A bayrağı X aktifken ve servis B CPU'nun %70'inin üzerindeyse, C servisindeki gecikme 6 dakika içinde %40 azalır" diyen bir çalışma kitabı yazmaz. Ama bu kalıp var. Tekrarlanabilir. Ve şu anda gözlemlenebilirlik verilerinizde duruyor, görünmez çünkü kimse onu bulmak için bir model oluşturmadı.
İşte @playerzeroai kapatmaya çalıştığı boşluk bu. Başka bir test koşucusu değil. Başka bir alarm eşiği değil. Meta'nın modelinin yerçekimini öğrendiği gibi, birikmiş gözlemden hangi şeylerin kırıldığını öğrenen bir üretim dünyası modeli. Test kapsamınızı kontrol etmiyor. Başarısızlık yörüngelerini öngörür.
Bir haftalık video çalışması, katı nesnelerin duvarlardan geçmediğini öğrenmek için yeterliydi.
Soru, bir modelin sizin sonraki kırılma yerinizi tahmin etmeye başlamadan önce ne kadar üretim gözlemi gerektirdiğidir.
...

En İyiler
Sıralama
Takip Listesi
