طبقنا كارباثي أوتو ريسيرش على الشطرنج من خلال أوبال، وكانت النتائج قوية. بدلا من الاعتماد على الكتب الافتتاحية أو النظرية المحفوظة، يتعلم النظام مباشرة من النتائج. يلعب الوكيل مباريات ضد نفسه، ويقيم المراكز باستخدام محرك، ويحدث السياسة، ويعيد تشغيل الحلقة مرة أخرى. مع مرور الوقت، تتراكم دورة التغذية الراجعة تلك. اللعب الذاتي -تقييم > -> تحديث السياسات -> التكرار. وكانت النتيجة تحسنا في تصنيف التصنيف +596. عندما تكون دائرة التعلم ضيقة، يتسارع التحسن بسرعة.