Kimi K2.5 من Moonshot AI هو الطراز #2 للأوزان المفتوحة، وهو متوفر الآن عبر 8 مزودين، كل منها بسعر وأداء مختلفين يعد Kimi K2.5 من @Kimi_Moonshot أحد نماذج الأوزان المفتوحة الرائدة، حيث حصل على تقييم 47 في مؤشر الذكاء للتحليل الاصطناعي، كما أن ترميزه القوي واستخدامه للأدوات يجعلانه نموذجا شائعا للاستخدام كعامل ترميز. نقوم بمقارنة نقاط نهاية نموذج K2.5 من 8 مزودي واجهات برمجة تطبيقات (API)، مع تفاوت سرعات الرموز بمقدار ~330 رمزا/ثانية بين أسرع وأبطأ المزودين - مما يجعل اختيار المزودين عاملا مهما. أهم النقاط المستخلصة من المقارنة المرجعية: ➤ ⚡ السرعة: @basetenco يخدم أسرع نقطة نهاية لنظام Kimi K2.5 عند 344 رمز إخراج في الثانية، يليه @FireworksAI_HQ (273 طن/ثانية) و@novita_labs (52 طن/ثانية) ➤ ⏳ التأخير: نتتبع TTFT (الوقت إلى أول رمز) وTTFAT (الوقت حتى أول رمز للإجابة). بالنسبة لنماذج المنطق، يعد TTFAT هو المقياس الرئيسي لأنه يحدد متى يرى المستخدمون مخرجات قابلة للاستخدام لأول مرة. يتصدر بيستن TTFAT بمعدل 6.5 ثانية، متقدما على Fireworks (7.7 ثانية) ونوفيتا AI (39.4 ثانية). في TTFT، يتصدر الذكاء الاصطناعي في Fireworks بزمن 0.36 ثانية، يليه @togethercompute (0.49 ثانية) وباستين (0.72 ثانية) ➤ 💲 التسعير: @DeepInfra هو أقل مزود تكلفة لأجهزة Kimi K2.5، بسعر 0.45 دولار/مليون رموز إدخال و2.25 دولار/مليون رمز إخراج، وهو أرخص بنسبة 25٪ من أغلى المزودين ➤ 🪟 نافذة السياق: جميع المزودين يدعمون نافذة السياق الكاملة بقيمة 256 ألف رمز باستثناء Baseten، الذي يدعم نافذة سياق 231k ➤ 🖼️ تعدد الوسائط: 7 من أصل 8 مزودين يدعمون قدرة الإدخال متعددة الوسائط الأصلية في Kimi K2.5، بينما يدعم Baseten فقط إدخال النص ➤ 🧰 الأدوات المدعومة: استدعاء الأدوات ووضع JSON مدعومان من جميع مزودي الخدمة الثمانية
نقوم بقياس TTFT (وقت الوصول إلى أول رمز) وTTFAT (حان الوقت للإجابة الأولى)، حيث يعد TTFAT هو المقياس الأساسي لنماذج التفكير. يتصدر بيستين بمعدل 6.5 ثانية TTFAT، بينما يتصدر Fireworks AI TTFT بزمن 0.36 ثانية.
قارن مقدمي خدمة Kimi K2.5 (المنطق) في 
‏‎2.56‏K