僅慢了 2% 的推理,卻獲得了 7.5 分的 GPQA 增益。絕對值得。