Ytterligare bevis är att LLM:er inte är medvetna och inte generaliserar någon information, och därför inte kommer att bli allmänt intelligenta, utan är faktiskt (fortfarande extremt användbara) utbildade statistiska responders.
Lossfunk
Lossfunk19 mars 22:14
🚨 Chockerande: Frontier LLM:er får 85–95 % på standardkodningsbenchmarks. Vi gav dem motsvarande problem i språk de inte kunde ha memorerat. De kollapsade till 0-11%. Presenterar EsoLang-Bench. Antagen till workshops i logiskt tänkande och ICBINB vid ICLR 2026 🧵
Datavetenskapsstudenter får kodningsutmaningar i språk de inte sett tidigare + med bara lite syntax och ombeds göra saker som att koda en Fibonacci-sekvens för att bevisa att de inte bara papegojar, hela tiden Och det sorterar ut folk, men inte 90 %
33