Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 BREAKING: Stanford hat gerade das unbequemste Papier über das Denken von LLMs veröffentlicht.
Es zeigt eine systematische Analyse, warum LLMs weiterhin scheitern, selbst wenn Ranglisten sagen, dass sie perfekt sind.
Sie unterteilen das Denken in zwei Kategorien: nicht verkörpert (Mathematik, Logik, gesunder Menschenverstand) und verkörpert (die physische Welt).. und die genau gleichen Fehler treten überall auf.
Eine der beunruhigendsten Erkenntnisse ist, wie oft Modelle untreue Schlussfolgerungen produzieren.. Modelle geben dir die richtige Endantwort, aber ihre Erklärung ist völlig erfunden oder logisch falsch. Es trainiert uns buchstäblich, einem gefälschten Entscheidungsprozess zu vertrauen..
Sie leiden auch unter grundlegenden architektonischen Fehlern (Kollaps unter leichter Logik) und Robustheitsfehlern (ein Wort in deinem Prompt zu ändern, kippt die gesamte Antwort). Und verkörpertes Denken? Noch schlimmer. LLMs haben null physische Verankerung, sodass sie bei grundlegender Physik vorhersehbar scheitern.
Die Erkenntnis:
LLMs denken gerade genug, um überzeugend zu klingen, aber nicht genug, um zuverlässig zu sein. Wir setzen Systeme ein, die Benchmarks bestehen, aber stillschweigend in der Produktion scheitern.

Top
Ranking
Favoriten
