متجر التطبيق اللامركزي | مركز Web3 للأحداث والألعاب

المواضيع الرائجة

طبقنا كارباثي أوتو ريسيرش على الشطرنج من خلال أوبال، وكانت النتائج قوية. بدلا من الاعتماد على الكتب الافتتاحية أو النظرية المحفوظة، يتعلم النظام مباشرة من النتائج. يلعب الوكيل مباريات ضد نفسه، ويقيم المراكز باستخدام محرك، ويحدث السياسة، ويعيد تشغيل الحلقة مرة أخرى. مع مرور الوقت، تتراكم دورة التغذية الراجعة تلك. اللعب الذاتي -تقييم > -> تحديث السياسات -> التكرار. وكانت النتيجة تحسنا في تصنيف التصنيف +596. عندما تكون دائرة التعلم ضيقة، يتسارع التحسن بسرعة.

الأفضل

المُتصدِّرة

التطبيقات المفضلة