一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

Sukh Sroay

用人工智能构建 • 分享利用技术、人工智能和机器人技术实现业务增长的有趣与实用方法

🚨突发：您的AI产品在一夜之间发生了变化。您没有收到电子邮件。您没有收到变更日志。您没有收到警告。您API调用另一端的模型与上周的模型不同。而且您没有办法证明这一点。这不是假设。GPT-4o在2025年2月的生产环境中改变了行为，完全没有提前通知。开发者通过损坏的JSON解析器和失败的分类器发现了这一点，而不是来自OpenAI。Anthropic在2025年期间对Claude版本进行了静默更新。每个主要提供商都这样做。行业称之为版本控制政策。凌晨2点发现这一点的工程师称之为其他东西。一篇提交给CAIS 2026的新论文提出了解决方案：LLM端点的行为指纹。这个想法很明确。一个模型有一个行为身份，不仅仅是它说什么，还有它怎么说。响应长度分布。拒绝模式。边缘案例提示的推理深度。格式化倾向。在相同输入下的令牌级一致性。这些信号足够稳定，可以作为指纹，并且在版本之间的差异足够大，可以检测到交换。您对您的端点运行指纹。您存储它。您明天再运行一次。如果指纹超出阈值发生变化，那么就有东西改变了。不是“您的提示中的某些东西。”不是“您的流量中的某些东西。”模型改变了。这是行业中没有人想公开谈论的部分。每个基于第三方API构建的AI产品都是在租用一个提供商的智能，而该提供商可以随时改变这种智能的性质。当GPT-4o去年改变其行为时，使用生产分类器的团队在他们的准确性崩溃时发现了这一点。使用生产JSON提取的团队在他们的解析器开始抛出错误时发现了这一点。使用微调下游管道的团队在他们的评估停止通过时发现了这一点。他们没有一个是从提供商那里发现的。版本锁定API端点的隐含合同是版本保持锁定。部署在这些端点上的经验现实是，它并没有保持锁定。行为指纹为开发者提供了他们目前没有访问的东西：证据。证明模型发生了变化的证据。发生变化的时间戳。一个不依赖于提供商的善意或变更日志纪律的信号。这具有超越开发者不便的直接安全影响。如果一个模型可以静默改变行为，那么在部署时进行的任何安全评估在下一个静默更新之前都是有效的。红队结果、对齐审计、行为基准——所有这些都是可以在不触发任何审查过程的情况下改变的系统快照。您评估的模型不一定是您用户现在正在交谈的模型。这篇论文有四页。它作为系统演示提交，而不是宏大的理论。这正是它所需的正确注册：一个实用工具，解决了每个使用这些系统的人都受到影响的问题，而没有人有正式描述的词汇。这个词汇是行为指纹。它解决的问题是问责制。