PinchBench-benchmarks utvärderar prestandan hos AI-modeller för stora språkmodeller i OpenClaws proxyuppgifter. Resultaten visar att Gemini 3 Flash leder med en framgångsfrekvens på 95,1 % i bearbetning av OpenClaw-uppgifter, medan minimax-m2.1 och kimi-k2.5 ligger tvåa respektive trea med 93,6 % respektive 93,4 %. Claude Sonnet 4,5 är 92,7 % och GPT-4o 85,2 %.