Makalah ini hampir terlalu bagus sehingga saya tidak ingin membagikannya Abaikan clickbait OpenClaw, OPD + RL pada tugas agen nyata dengan hasil yang signifikan sangat menarik, dan menjauhkan kita dari kebutuhan hadiah yang dapat diverifikasi Penulis: @YinjieW2024 Xuyang Chen, Xialong Jin, @MengdiWang10 @LingYang_PU