FLUX.2 [klein] 9B acaba de ser el doble de más rápido editando imágenes, especialmente cuando usas varias imágenes de referencia. Misma calidad, sin aumento de precio.
En secreto: el KV-caching permite que el modelo se salte el cálculo redundante en tus imágenes de referencia. Cuantas más referencias uses, mayor será la velocidad. La inferencia es hasta 2x+ más rápida para la edición multirreferencia.
También estamos lanzando pesos cuantizados FP8, construidos con @NVIDIA_AI_PC Ejecuta Klein 9B con menos VRAM y una inferencia más rápida para despliegues locales y autoalojados.
191