FLUX.2 [klein] 9Bは、特に複数の参照画像を使うと画像編集が2倍速くなりました。品質は同じで、値上がりもありません。
裏では、KVキャッシュによりモデルは参照画像の冗長計算をスキップできます。参考文献を多く使うほど、スピードアップは大きくなります。 マルチリファレンス編集では推論が最大2倍+高速です。
また、FP8の量子化重みもリリースします。@NVIDIA_AI_PC ローカルおよびセルフホスト展開のために、VRAMを減らし推論速度を上げるKlein 9Bを運用しましょう。
165