🚨 AKTUÁLNÍ: Stanford právě zveřejnil nejnepříjemnější článek o logice LLM. Ukazuje systematické rozebírání toho, proč LLM stále selhávají, i když žebříčky ukazují, že jsou dokonalé. Rozdělili uvažování do dvou kategorií: nehmotné (matematika, logika, zdravý rozum) a ztělesněné (fyzický svět).. A přesně stejné selhání se objevují všude. Jedním z nejznepokojivějších zjištění je, jak často modely vytvářejí nevěrné uvažování... Modely vám dají správnou konečnou odpověď, ale jejich vysvětlení je zcela vymyšlené nebo logicky špatné. Doslova nás to učí důvěřovat falešnému rozhodovacímu procesu... Trpí také zásadními architektonickými selháním (kolaps pod lehkou logikou) a selháním robustnosti (změna jednoho slova v zadání převrátí celou odpověď). A ztělesněné uvažování? Ještě horší. LLM nemají žádné fyzikální uzemnění, takže v základní fyzice selhávají předvídatelně. Poučení: LLM rozumují právě tolik, aby zněly přesvědčivě, ale ne natolik, aby byly spolehlivé. Nasazujeme systémy, které projdou benchmarky, ale v produkci tiše selžou.