さらに、LLMは意識的ではなく情報を一般化しておらず、一般的に知的になるわけではなく、実際には(それでも非常に有用な)訓練された統計応答者であることを証明しています。
Lossfunk
Lossfunk3月19日 22:14
🚨 驚くべきことに、FrontierのLLMは標準的なコーディングベンチマークで85〜95%のスコアを記録しています。私たちは、彼らが暗記できない言語で同等の問題を出しました。彼らは0〜11%まで崩落しました。 エソラングベンチの紹介。 ICLR 2026 🧵の論理推論およびICBINBワークショップへの受講
コンピュータサイエンスの卒業生は、見たことのない言語+少しの構文だけのコーディングチャレンジが与えられ、フィボナッチ数列をコーディングして単なる真似をしていないことを証明するなど、常に求められます それで人をふるいにかけることはできますが、90%ではありません
57