🚨 BREAKING: Stanford, LLM mantığı hakkında en rahatsız edici makaleyi düşürdü. Bu, LLM'lerin neden sürekli başarısız olduğunun sistematik olarak yıkılmasını gösteriyor, lider tabloları mükemmel olduklarını söylese bile. Akıl yürütmeyi iki bölüme ayırıyorlar: bedensiz (matematik, mantık, sağduyu) ve bedenli (fiziksel dünya).. Ve aynı başarısızlıklar her yerde ortaya çıkıyor. En rahatsız edici bulgulardan biri, modellerin ne sıklıkla sadık olmayan akıl yürütmeleri üretmesidir.. Modeller size doğru nihai cevabı verir, ancak açıklamaları tamamen uydurma veya mantıksal olarak yanlıştır. Bizi sahte bir karar sürecine güvenmeye gerçekten eğitir... Ayrıca temel mimari hatalardan (ışık mantığı altında çökme) ve dayanıklılık hatalarından (promptunuzda bir kelimeyi değiştirmek tüm cevabı değiştirir) de zarar görürler. Ve bedenli akıl yürütme mi? Daha da kötü. LLM'lerin fiziksel temeli sıfırdır, bu yüzden temel fizikte tahmin edilebileceği şekilde başarısız olurlar. Çıkarılacak sonuç: LLM'ler inandırıcı görünecek kadar mantıklı ama güvenilir olacak kadar değil. Kıyaslamaları geçen ama üretimde sessizce başarısız olan sistemler kuruyoruz.