Matt Maher testoval modely hranic v Cursor vs. jiné svazky. Kurzor zvýšil výkon modelu v průměru o 11 %: Blíženci: 52 % → 57 % GPT-5.4: 82 % → 88 % Opus: 77 % → 93 % Jeho benchmark měří, jak dobře modely implementují PRD se 100 funkcemi. @cursor_ai neustále překonávají.