𝗞-𝗺𝗲𝗮𝗻𝘀 𝗲𝘀𝘁 𝘀𝗶𝗺𝗽𝗹𝗲. 𝗠𝗮𝗸𝗶𝗻𝗴 𝗶𝘁 𝗳𝗮𝘀𝘁 𝗼𝗻 𝗚𝗣𝗨𝘀 𝗻’𝗲𝘀𝘁 𝗽𝗮𝘀. C’est pourquoi nous avons construit Flash-KMeans — une implémentation sensible aux entrées/sorties du k-means exact qui repense l’algorithme autour des goulets d’étranglement modernes des GPU. En s’attaquant directement aux goulets d’étranglement de la mémoire, Flash-KMeans atteint un gain de vitesse de 30x par rapport à cuML et de 200x par rapport à FAISS — avec le même algorithme exact, juste conçu pour le matériel d’aujourd’hui. À l’échelle du million, Flash-KMeans peut compléter une itération de k-means en quelques millisecondes. Un algorithme classique — repensé pour les GPU modernes. Article : Code :