Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Meer bewijs dat LLM's niet bewust zijn en geen informatie generaliseren, en daarom niet algemeen intelligent zullen worden, maar in feite (nog steeds extreem nuttig) getrainde statistische respondenten zijn.

19 mrt, 22:14
🚨 Schokkend: Frontier LLM's scoren 85-95% op standaard programmeerbenchmarks. We gaven ze equivalente problemen in talen die ze niet konden hebben gememoriseerd. Ze zakten naar 0-11%.
Hier presenteren we EsoLang-Bench.
Geaccepteerd voor de workshops Logisch Redeneren en ICBINB op ICLR 2026 🧵
Compsci-afgestudeerden krijgen programmeeruitdagingen in talen die ze nog niet eerder hebben gezien + met slechts een beetje syntaxis en worden gevraagd om dingen te doen zoals het coderen van een Fibonacci-reeks om te bewijzen dat ze niet alleen maar herhalen, de hele tijd
En dat filtert mensen eruit, maar niet 90%.
68
Boven
Positie
Favorieten
