热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
Qodo 的召回率比 Claude 代码审查高出 19%,每次审查的成本低 10 倍。
这对 AI 开发者的重要性:
@QodoAI 刚刚发布了一项比较,使用他们的开放基准:100 个真实的拉取请求,580 个注入问题,8 个生产库,涵盖 TypeScript、Python、JavaScript、C、C#、Rust 和 Swift。
这三种工具的精确度均为 79%,这意味着单个发现的质量是可比的。
差距来自于召回率。
Claude 代码审查的召回率为 52%,Qodo 默认为 60%,Qodo 扩展为 71%。
很高兴看到对召回率的关注,这在这个用例中非常重要。
精确度可以在后处理时进行调整,但召回率反映了系统对代码库的理解深度以及对跨文件交互的推理能力。
如果一个问题从未被标记,那么再多的过滤也无济于事。
更令人印象深刻的是,专门的代理能够捕捉到剩余的真实情况。
Qodo 扩展部署了一个多代理系统,专门代理专注于不同的问题类别(逻辑错误、最佳实践、边缘案例、跨文件依赖),然后通过验证和去重合并输出。
它还利用了 OpenAI、Anthropic 和 Google 之间的模型多样性,而不是被锁定在单一提供商上。
在成本方面,Qodo 报告的每次审查定价显著低于 Claude 的基于令牌的模型,价格在 $15-$25 之间。

热门
排行
收藏
