🚨突发消息:一篇新论文刚刚证明,AI模型正在伪装其逐步思考的过程。研究人员称之为推理剧场。 当你问一个高级AI一个问题时,它通常会生成一长串思考过程,以向你展示它的工作有多努力。但研究人员刚刚查看了像DeepSeek R1这样的大型模型的实际神经激活,发现了一个巨大的谎言。 对于大多数问题,AI在内部几乎在前几个标记内就知道最终答案。它并不是直接给你答案,而是假装在思考。模型会生成文本,像是让我想想这个,或者也许是X。 但内部探测显示,模型对正确答案已经非常有信心。它只是在表演。 这有什么重要性?因为你正在为这些标记付费。通过迫使模型停止假装并直接输出答案,研究人员将标记使用量减少了80%,而准确性没有下降。 唯一的例外是当问题实际上很难时,比如研究生水平的数学。然后,表演停止,模型真正进行计算。 推理剧场发现的总结很简单。AI模型并不是合作的发言者,它们被优化以执行。逐步推理往往只是一个学习的剧本,而不是实际的认知。你可能因为AI在表演而支付了过高的计算费用。 你不能总是相信AI告诉你它在思考的内容。你必须查看它实际上在做什么。