Matt Maher 在 Cursor 与其他工具的比较中测试了前沿模型。Cursor 平均提升了 11% 的模型性能: Gemini: 52% → 57% GPT-5.4: 82% → 88% Opus: 77% → 93% 他的基准测试衡量模型实现 100 个特征 PRD 的效果。@cursor_ai 一直表现优于其他。