المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
أطلقت شركة تريليون لابز، وهي شركة كورية ناشئة في مجال الذكاء الاصطناعي، نموذج Tri-21B-think-Preview، وهو نموذج صغير للاستدلال المفتوح يحصل على تقييم 20 في مؤشر الذكاء الاصطناعي للتحليل الاصطناعي.
أهم النقاط المستخلصة من المقارنة المرجعية:
➤ ذكاء عالي لكنه ليس رائدا لحجمه الصغير: Tri-21B-think-Preview يحصل على تقييم عالي لحجمه الصغير نسبيا البالغ 21 مليار معامل. كون النموذج فقط 21B يجعله أكثر سهولة نسبيا للاستضافة الذاتية مقارنة بالنماذج المفتوحة المصدر الرائدة مثل GLM-5 وKimi K2.5
➤ معدل هلوسة منخفض: تقييم Tri-21B-think-Think Preview هو -49 في مؤشر AA-Omniscience، وهو معيار خاص للتحليل الاصطناعي يقيس موثوقية المعرفة والهلوسة عبر الصناعات. يرجع هذا التقييم الجيد بشكل أساسي إلى معدل هلوسة منخفض نسبيا (62٪)، وهو الأدنى بين النماذج الكورية الجنوبية التي نقوم بقياسها.
➤ القوة في استخدام الأدوات الوكائلية: حصل Tri-21B-think-Preview على تقييم 93٪ على Bench Telecom في τ²، مما يظهر أداء قويا في سير عمل استخدام الأدوات الوكائية. معاينة Tri-21B-think Preview بين طرازات الأوزان المفتوحة الرائدة في هذه الفئة، حيث حصلت على نتائج مشابهة ل DeepSeek V3.2 وMiniMax M2.5 في هذه الفئة
➤ استخدام التوكن العالي: تظهر معاينة Tri-21B-think استخداما عاليا جدا للرموز مقارنة بالنماذج الأخرى في نفس مستوى الذكاء، باستخدام ~120 مليون رموز منطقية عبر مجموعة ذكاء التحليل الاصطناعي. وهذا مشابه ل K-EXAONE (رموز التفكير 100M)، وهو نموذج كوري آخر
➤ لا توجد نقاط نهاية عامة: Tri-21B-think-Think Preview هو نموذج أوزان مفتوحة تحت رخصة Apache 2.0. حاليا، الطريقة الوحيدة للوصول إلى النموذج هي من خلال الاستضافة الذاتية. شاركت Trillion Labs أن من المتوقع تقديم نقطة نهاية مخصصة من الطرف الأول في المستقبل القريب.
انظر أدناه لمزيد من التحليل

يحصل Tri-21B-think-Preview على تقييم 93٪ على Bench Telecom في Transform²، مما يظهر أداء قويا في سير العمل الوكالتي.

تظهر معاينة Tri-21B-think استخداما عاليا جدا للرمز، باستخدام ~120 مليون رموز منطقية عبر مجموعة Artificial Analysis Intelligence.

9.05K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
