🚨 عاجل: عرض الباحثون الميتا نموذجا لمدة مليوني ساعة من الفيديو. لا تسميات. لا يوجد كتاب فيزياء. لا يوجد أي إشراف على الإطلاق. ثم عرضوا مقطعا حيث يختفي جسم خلف جدار ولا يعود أبدا. النموذج أشار إلى أنه خاطئ. 🤯 لقد تعلم ديمومة الشيء. قوام الشكل. ديناميكيات التصادم. كلها من المشاهدة. وما هو أكثر إثارة للدهشة: حتى نموذج تم تدريبه على أسبوع واحد فقط من الفيديو الفريد حقق أداء فوق الصدفة في اكتشاف مخالفات الفيزياء. هذا ليس صدفة. هذا مبدأ. النقطة الأساسية من الورقة: هذا يعمل فقط عندما يتنبأ النموذج في فضاء تمثيل مكتسب، وليس بالبكسل الخام. يجب على النموذج بناء نموذج عالم داخلي، مضغوط ومجرد، والتنبؤ بذلك. فشل التنبؤ بفضاء البكسل. نماذج اللغة الكبيرة متعددة الوسائط التي تفسر عبر النص تفشل. فقط البنية التي تبني تمثيلات مجردة مع التنبؤ بالمدخلات الحسية المفقودة، وهي شيء قريب من وصف علماء الأعصاب للترميز التنبؤي، تكتسب الحدس الفيزيائي فعليا. وهذا يعني أن المعرفة الأساسية التي افترضوا الباحثون أنها مبرمجة قد تكون مجرد ملاحظة على نطاق واسع. يتعلم الأطفال ديمومة الأشياء من خلال مشاهدة الأشياء. اتضح أن نفس المبدأ ينطبق هنا. الآن هذا هو الجزء الذي لا يتحدث عنه أحد. إذا كانت الملاحظة وحدها تعلم النموذج قواعد العالم الفيزيائي، فماذا يحدث عندما تطبق نفس المبدأ على أنظمة الإنتاج؟ الإنتاج يحتوي أيضا على الفيزياء. ليس الجاذبية. لكن القواعد متسقة بنفس القدر: أي النشر يسبب حوادث عند الساعة 3 صباحا، أي تركيبات الإعدادات تتفاعل بشكل خطير، أي مسارات الشيفرة تتدهور بهدوء تحت الحمل، أي تغييرات الخدمة تسبب أعطالا على بعد قفزتين. هذه الأنماط متجذرة في آلاف المسارات. دفع الكود، التحولات القياسية، مخالفات العملاء، جداول الحوادث. لم يلاحظ ذلك إلى حد كبير. بالتأكيد غير معنون. لا أحد يكتب دفتر تشغيل يقول "إذا نشرت الخدمة أ مع العلم X نشط والخدمة ب فوق 70٪ من وحدة المعالجة المركزية، فإن التأخير في الخدمة ج ينخفض بنسبة 40٪ خلال 6 دقائق." لكن هذا النمط موجود. إنه قابل للتكرار. وهي موجودة الآن في بيانات قابلية الملاحظة الخاصة بك، غير مرئية لأن لا أحد قد بنى نموذجا للعثور عليها. هذه هي الفجوة التي تحاول @playerzeroai تقليصها. ليس عداءا آخر من الاختبار. لا يوجد حد تنبيه آخر. نموذج عالم الإنتاج يتعلم الأشياء التي تنكسر من الملاحظة المتراكمة، بنفس الطريقة التي تعلم بها نموذج ميتا الجاذبية. لا يفحص تغطية اختبارك. يتنبأ بمسارات الفشل. أسبوع واحد من الفيديو كان كافيا لأتعلم أن الأجسام الصلبة لا تمر عبر الجدران. السؤال هو كم من مراقبة الإنتاج التي يحتاجها نظامك قبل أن يبدأ النموذج في التنبؤ بمكان تعطل جهازك التالي. ...