𝗞-𝗺𝗲𝗮𝗻𝘀 𝗶𝘀 𝘀𝗶𝗺𝗽𝗹𝗲. 𝗠𝗮𝗸𝗶𝗻𝗴 𝗶𝘁 𝗳𝗮𝘀𝘁 𝗼𝗻 𝗚𝗣𝗨𝘀 𝗶𝘀𝗻’𝘁. Daarom hebben we Flash-KMeans gebouwd — een IO-bewuste implementatie van exacte k-means die het algoritme heroverweegt rond moderne GPU-flessenhalzen. Door de geheugenflessenhalzen direct aan te pakken, bereikt Flash-KMeans een snelheidstoename van 30x ten opzichte van cuML en 200x ten opzichte van FAISS — met hetzelfde exacte algoritme, gewoon ontworpen voor de hardware van vandaag. Op het miljoen-niveau kan Flash-KMeans een k-means iteratie in milliseconden voltooien. Een klassiek algoritme — opnieuw ontworpen voor moderne GPU's. Paper: Code: