متجر التطبيق اللامركزي | مركز Web3 للأحداث والألعاب

المواضيع الرائجة

أردت أن أقدم بعض التوضيحات، والتي نعتقد أنها كانت واضحة في ورقتنا البحثية لكنها لم تكن واضحة في منشوري الأصلي (إعادة تحليل بيانات @METR_Evals). مساهمتنا هي افتراض التقدم كمنتج مضاعف للسيجمويدات حول ابتكارات مختلفة. بالنظر إلى بيانات METR، قسمناها إلى تحسينات في قدرات القاعدة (حجم البيانات/النموذج) والمنطق. نظهر أن هذا المنتج يوفر ملاءمة *داخل العينة* مماثلة لمجموعات البيانات الصغيرة التي نلاحظها كنمو أسي. ومع ذلك، التداعيات مختلفة تماما! وبموجب نموذجنا، سنحتاج إلى ابتكارات مستمرة (تشبه التفكير) لنرى تقدما أسيا مستمرا. هذا لا يعني أننا نستبعد التقدم الأسي، أو أن ناتج السيجمويدات هو النموذج الصحيح. هذا ببساطة يعني أن هناك نقاطا قليلة ونماذج أساسية متعددة محتملة ذات دلالات مختلفة تماما. ملاءمة سيغمويد منتجنا تناسب بشكل جيد جدا عند استخدام GPT 5.2 و/أو Gemini 3 Pro. نبدو أسوأ عندما نحمل أيضا كلود أوبوس 4.5، لكننا لا يزالون معقولين. هدفنا ليس الجدال حول مقاييس OOS في عدد قليل من البيانات، بل الإشارة إلى أن التوقعات الحالية هشة، ولا تمثل تسلسل الابتكارات المختلفة. (هناك بعض التركيبات الأخرى حول X، لكن لا يبدو أنهم يستخدمون سيجمويد المنتج المقترح لذا لا أستطيع أن أقول ما الذي يحدث هناك...) أعتذر عن منشوري السابق غير الدقيق – نأمل أن يقرأ الناس الصحيفة!

الأفضل

المُتصدِّرة

التطبيقات المفضلة