FLUX.2 [klein] 9B vient de devenir 2x plus rapide pour l'édition d'images, surtout lorsque vous utilisez plusieurs images de référence. Même qualité, pas d'augmentation de prix.
Sous le capot : le KV-caching permet au modèle d'éviter les calculs redondants sur vos images de référence. Plus vous utilisez de références, plus l'accélération est importante. L'inférence est jusqu'à 2x+ plus rapide pour l'édition multi-références.
Nous publions également des poids quantifiés FP8, construits avec @NVIDIA_AI_PC Exécutez Klein 9B avec moins de VRAM et une inférence plus rapide pour des déploiements locaux et auto-hébergés.
170