K-means on yksinkertainen. Nopean tekeminen GPU:illa ei ole. Siksi rakensimme Flash-KMeansin — IO-tietoisen toteutuksen täsmälleen k-meansista, joka miettii algoritmia uudelleen nykyaikaisten GPU-pullonkauloiden ympärillä. Hyökkäämällä suoraan muistin pullonkauloihin Flash-KMeans saavuttaa 30-kertaisen nopeutuksen cuML:ään verrattuna ja 200-kertaisen FAISS:n nopeuden — täsmälleen samalla algoritmilla, joka on suunniteltu nykyiselle laitteistolle. Miljoonan mittakaavassa Flash-KMeanit voivat suorittaa k-mean-iteroinnin millisekunneissa. Klassinen algoritmi — uudistettu moderneille näytönohjaimille. Artikkeli: Koodi: