FLUX.2 [klein] 9B blev precis 2x snabbare vid bildredigering, särskilt när man använder flera referensbilder. Samma kvalitet, ingen prisökning.
Under huven: KV-caching låter modellen hoppa över redundant beräkning på dina referensbilder. Ju fler referenser du använder, desto större blir hastighetsökningen. Inferens är upp till 2x+ snabbare för multireferensredigering.
Vi släpper också FP8-kvantiserade vikter, byggda med @NVIDIA_AI_PC Kör Klein 9B med mindre VRAM och snabbare inferenser för lokala och självhostade distributioner.
175