O benchmark PinchBench avalia o desempenho de modelos de linguagem AI em tarefas de proxy OpenClaw. Os resultados mostram que o Gemini 3 Flash lidera com uma taxa de sucesso de 95,1% nas tarefas OpenClaw, seguido pelo minimax-m2.1 e kimi-k2.5 com 93,6% e 93,4%, respectivamente. O Claude Sonnet 4.5 obteve 92,7%, enquanto o GPT-4o ficou com 85,2%.