K-significa es sencillo. Hacerlo rápido en GPUs no lo es. Por eso creamos Flash-KMeans — una implementación consciente de IO de k-means exactos que replantea el algoritmo alrededor de los cuellos de botella de las GPUs modernas. Al atacar directamente los cuellos de botella de memoria, Flash-KMeans logra una aceleración de 30 veces más que cuML y 200 veces más que FAISS — con el mismo algoritmo exacto, solo que diseñado para el hardware actual. A escala millonaria, los Flash-KMeans pueden completar una iteración k-media en milisegundos. Un algoritmo clásico — rediseñado para GPUs modernas. Papel: Código: