Testy wydajnościowe PinchBench oceniają działanie modeli językowych AI w zadaniach z OpenClaw. Wyniki pokazują, że Gemini 3 Flash prowadzi z 95,1% skutecznością w realizacji zadań OpenClaw, a minimax-m2.1 i kimi-k2.5 zajmują odpowiednio 2. i 3. miejsce z wynikami 93,6% i 93,4%. Claude Sonnet 4.5 osiągnął 92,7%, a GPT-4o 85,2%.