K-meansは単純です。GPUで高速にすることは問題ではありません。 だからこそ、私たちはFlash-KMeansを開発しました。これは、現代のGPUボトルネックを回避したアルゴリズムを再考する、IO対応の正確なk-means実装です。 メモリのボトルネックに直接攻めることで、Flash-KMeansはcuML上で30倍、FAISS上で200倍の高速化を実現しています。これは、現代のハードウェア向けに設計されたまったく同じアルゴリズムで実現しています。百万スケールでは、Flash-KMeansはk-meansの反復をミリ秒単位で完了できます。 古典的なアルゴリズムを現代GPU向けに再設計したものです。 論文: コード: