𝗞-𝗺𝗲𝗮𝗻𝘀 𝗶𝘀 𝘀𝗶𝗺𝗽𝗹𝗲. 𝗠𝗮𝗸𝗶𝗻𝗴 𝗶𝘁 𝗳𝗮𝘀𝘁 𝗼𝗻 𝗚𝗣𝗨𝘀 𝗶𝘀𝗻’𝘁. Dlatego stworzyliśmy Flash-KMeans — implementację k-średnich, która uwzględnia IO i przemyśla algorytm w kontekście nowoczesnych wąskich gardeł GPU. Atakując bezpośrednio wąskie gardła pamięci, Flash-KMeans osiąga 30-krotne przyspieszenie w porównaniu do cuML i 200-krotne przyspieszenie w porównaniu do FAISS — przy tym samym algorytmie, po prostu zaprojektowanym dla dzisiejszego sprzętu. Przy skali miliona, Flash-KMeans może zakończyć iterację k-średnich w milisekundach. Klasyczny algorytm — zaprojektowany na nowo dla nowoczesnych GPU. Artykuł: Kod: