データエンジニアリングのために @karpathy の自動調査を試しました。 Claudeは、未記録のエンドポイントを見つけ、アーカイブをスクレイピングし、分析に必要なデータを取得するために非常に創造的な方法を模索しながら、自主的に完全なデータセットを構築しました 興味深いのは、実験が何かを残す価値があるかどうかを即座に判断するスコアは得られないため、クロードは実験を行い、何を残す価値があるかを判断することです ですので、たとえ問題が直接検証できなくても、AIは自分自身で結果を評価し、進歩を続ける能力があるはずです