FLUX.2 [klein] 9B baru saja menjadi 2x lebih cepat dalam pengeditan gambar, terutama ketika Anda menggunakan beberapa gambar referensi. Kualitas yang sama, tidak ada kenaikan harga.
Di bawah tenda: KV-caching memungkinkan model melewati komputasi redundan pada gambar referensi Anda. Semakin banyak referensi yang Anda gunakan, semakin besar percepatannya. Inferensi hingga 2x+ lebih cepat untuk pengeditan multi-referensi.
Kami juga merilis bobot terukur FP8, dibuat dengan @NVIDIA_AI_PC Jalankan Klein 9B dengan VRAM yang lebih sedikit dan inferensi yang lebih cepat untuk penyebaran lokal dan yang dihosting sendiri.
164