Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Plus de preuves que les LLM ne sont pas conscients et ne généralisent aucune information, et qu'ils ne vont donc pas devenir intelligents de manière générale, mais qu'ils sont en fait (toujours extrêmement utiles) des répondeurs statistiques entraînés.

il y a 23 heures
🚨 Choquant : Les LLMs Frontier obtiennent des scores de 85 à 95 % sur des benchmarks de codage standard. Nous leur avons donné des problèmes équivalents dans des langages qu'ils n'auraient pas pu mémoriser. Ils se sont effondrés à 0-11 %.
Présentation d'EsoLang-Bench.
Accepté aux ateliers de Raisonnement Logique et ICBINB à l'ICLR 2026 🧵
Les diplômés en informatique reçoivent des défis de codage dans des langages qu'ils n'ont jamais vus auparavant + avec juste un peu de syntaxe et on leur demande de faire des choses comme coder une séquence de Fibonacci pour prouver qu'ils ne se contentent pas de répéter, tout le temps
Et cela élimine des gens, mais pas 90%.
28
Meilleurs
Classement
Favoris
