K-means — це просто. Зробити його швидким на GPU — це не так. Саме тому ми створили Flash-KMeans — реалізацію точних k-засобів, орієнтовану на IO, яка переосмислює алгоритм навколо сучасних вузьких місць GPU. Атакуючи вузькі місця пам'яті напряму, Flash-KMeans досягає 30-кратного прискорення порівняно з cuML і 200-кратного прискорення через FAISS — за тим самим алгоритмом, тільки розробленим для сучасного обладнання. На мільйонному масштабі Flash-KMean можуть виконати ітерацію k-середніх за мілісекунди. Класичний алгоритм — перероблений для сучасних GPU. Стаття: Код: