Benchmarky PinchBench hodnotí výkon velkých jazykových modelů AI v proxy úlohách OpenClaw. Výsledky ukazují, že Gemini 3 Flash vede s úspěšností 95,1 % při zpracování úloh OpenClaw, zatímco minimax-m2.1 a kimi-k2.5 jsou na druhém a třetím místě s 93,6 % a 93,4 %. Claude Sonnet 4.5 je 92,7 % a GPT-4o 85,2 %.