热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Sukh Sroay
用人工智能构建 • 分享利用技术、人工智能和机器人技术实现业务增长的有趣与实用方法
🚨突发:您的AI产品在一夜之间发生了变化。您没有收到电子邮件。您没有收到变更日志。您没有收到警告。
您API调用另一端的模型与上周的模型不同。
而且您没有办法证明这一点。
这不是假设。GPT-4o在2025年2月的生产环境中改变了行为,完全没有提前通知。开发者通过损坏的JSON解析器和失败的分类器发现了这一点,而不是来自OpenAI。Anthropic在2025年期间对Claude版本进行了静默更新。每个主要提供商都这样做。
行业称之为版本控制政策。凌晨2点发现这一点的工程师称之为其他东西。
一篇提交给CAIS 2026的新论文提出了解决方案:LLM端点的行为指纹。
这个想法很明确。一个模型有一个行为身份,不仅仅是它说什么,还有它怎么说。响应长度分布。拒绝模式。边缘案例提示的推理深度。格式化倾向。在相同输入下的令牌级一致性。这些信号足够稳定,可以作为指纹,并且在版本之间的差异足够大,可以检测到交换。
您对您的端点运行指纹。您存储它。您明天再运行一次。如果指纹超出阈值发生变化,那么就有东西改变了。
不是“您的提示中的某些东西。”不是“您的流量中的某些东西。”模型改变了。
这是行业中没有人想公开谈论的部分。
每个基于第三方API构建的AI产品都是在租用一个提供商的智能,而该提供商可以随时改变这种智能的性质。当GPT-4o去年改变其行为时,使用生产分类器的团队在他们的准确性崩溃时发现了这一点。使用生产JSON提取的团队在他们的解析器开始抛出错误时发现了这一点。使用微调下游管道的团队在他们的评估停止通过时发现了这一点。
他们没有一个是从提供商那里发现的。
版本锁定API端点的隐含合同是版本保持锁定。部署在这些端点上的经验现实是,它并没有保持锁定。
行为指纹为开发者提供了他们目前没有访问的东西:证据。证明模型发生了变化的证据。发生变化的时间戳。一个不依赖于提供商的善意或变更日志纪律的信号。
这具有超越开发者不便的直接安全影响。
如果一个模型可以静默改变行为,那么在部署时进行的任何安全评估在下一个静默更新之前都是有效的。红队结果、对齐审计、行为基准——所有这些都是可以在不触发任何审查过程的情况下改变的系统快照。
您评估的模型不一定是您用户现在正在交谈的模型。
这篇论文有四页。它作为系统演示提交,而不是宏大的理论。
这正是它所需的正确注册:一个实用工具,解决了每个使用这些系统的人都受到影响的问题,而没有人有正式描述的词汇。
这个词汇是行为指纹。
它解决的问题是问责制。

3
🚨重磅消息:有人开源了一款应用,可以将任何Android手机变成SMS网关,并提供完整的REST API。
它叫做SMS Gateway for Android。这不是一个可疑的短信应用。
它是一个自托管的SMS基础设施层 - 安装APK,暴露API,并可以从任何应用、服务器或脚本中以编程方式发送或接收SMS。
它实际上做了什么:
→ 直接在你的手机上暴露REST API - 通过curl或任何HTTP客户端发送SMS
→ 在你的网络上本地工作,或在设备IP动态时通过云中继工作
→ 对于接收的SMS和MMS提供Webhook - 实时将消息接收至你自己的服务器
→ 端到端加密 - 消息内容和电话号码在离开设备之前加密
→ 支持多张SIM卡 - 选择每条消息发送的SIM
→ 支持多设备 - 在一组手机中分发消息
→ 支持Android 5.0及以上版本 - 任何放在抽屉里的旧Android手机都可以使用
最疯狂的部分是:
Twilio每条SMS收费$0.0079。
这使用你现有的手机计划。
对于2FA通知、事务性消息和SMS警报 - 一部运行此应用的旧Android手机每条消息的费用为零。
875个GitHub星标。105个版本。积极维护中。
100%开源。Apache-2.0许可证。
(链接在评论中)

7
热门
排行
收藏
