Matt Maher 測試了 Cursor 與其他工具的前沿模型。Cursor 平均提升了 11% 的模型性能: Gemini: 52% → 57% GPT-5.4: 82% → 88% Opus: 77% → 93% 他的基準測試衡量模型實現 100 特徵 PRD 的效果。@cursor_ai 一直表現優於其他。