K-betyr er enkelt. Å gjøre det raskt på GPU-er er det ikke. Derfor bygde vi Flash-KMeans — en IO-bevisst implementering av eksakte k-means som tenker nytt om algoritmen rundt moderne GPU-flaskehalser. Ved å angripe minneflaskehalsene direkte, oppnår Flash-KMeans 30x hastighetsøkning over cuML og 200x hastighetsøkning over FAISS — med nøyaktig samme algoritme, bare utviklet for dagens maskinvare. På millionskala kan Flash-KMeans fullføre en k-means iterasjon på millisekunder. En klassisk algoritme — redesignet for moderne GPU-er. Artikkel: Kode: