我尝试了 @karpathy 的自动研究用于数据工程。 claude 自主构建了一个完整的数据集,通过寻找未记录的端点、抓取档案以及找到非常有创意的方法来获取我想要的数据进行分析。 有趣的是,你并不会立即得到一个分数来告诉你实验是否产生了值得保留的结果,因此 claude 同时进行实验并决定什么是值得保留的。 所以即使你的问题并不直接可验证,人工智能可能足够有能力评估自己的结果并不断取得进展。