من الرائع رؤية @AMD تختار vLLM كأحد أطر الاستدلال المخصصة لهاكاثون GPU MODE. 🎉 التحدي: دفع أداء الاستدلال الشامل Kimi K2.5 1T FP4 على معالج 8× AMD Instinct MI355X — باستخدام vLLM أو AMD ATOM. الجائزة الكبرى: 650,000 دولار. ما يجعل هذا مختلفا: يجب أن تكون التحسينات الناجحة قابلة للدمج مع AMD ATOM أو vLLM في المراحل العليا. التحسينات التي تتحقق في vLLM تعود بالنفع على المجتمع بأكمله. المرحلة الأولى (تحسين النواة) تستمر حتى 6 أبريل. مزيد من التفاصيل ⬇️