K-Means بسيط. جعلها سريعة على بطاقة الرسوميات ليست كذلك. فلاش-KMeans هو تنفيذ واع بالإخراج (IO) لقيم k دقيقة يعيد التفكير في الخوارزمية حول عنق الزجاجة الحديثة لوحدات معالجة الرسوميات. من خلال مهاجمة عنق الزجاجة في الذاكرة مباشرة، يحقق فلاش-كي ميانز: - زيادة 30 مرة في السرعة عبر cuML - زيادة سرعة 200x عبر FAISS باستخدام نفس الخوارزمية بالضبط، مصممة خصيصا لأجهزة اليوم. على مقياس المليون، يمكن لأجهزة فلاش-KMeans إكمال تكرار k-mean في أجزاء من الثانية. إليك سبب أهمية هذا اليوم: كان K-means دائما بدائيا غير متصل. شيء تشغله مرة واحدة لمعالجة البيانات مسبقا ثم المضي قدما. هذه التسرعات تغير ذلك. ↳ تستخدم قواعد البيانات المتجهية مثل FAISS الوسائل k لبناء مؤشرات البحث. ال k-means الأسرع يعني أنه يمكنك إعادة الفهرسة ديناميكيا مع تغير البيانات، وليس دفعتها بين ليلة وضحاها. ↳ تحتاج طرق التكميم في النماذج الكبيرة إلى k-means للعثور على كتب رموز الأوزان المثلى، لكل طبقة، بشكل متكرر. ما يستغرق ساعات قد يستغرق الآن دقائق. ↳ نماذج MoE تحتاج إلى توجيه سريع للرموز عند وقت الاستدلال. يعني k في مللي ثانية أنه من الممكن تشغيل هذا داخل حلقة الاستدلال، وليس فقط في المعالجة المسبقة. 200x فوق FAISS هو الرقم الذي يجب استيعابه. FAISS هو المعيار الصناعي. معظم أنظمة البحث الإنتاجية في الاتجاهات تقع فوقها. رابط الورقة والرمز في التغريدة القادمة!