FLUX.2 [klein] 9B se právě dvakrát zrychlil v úpravě obrázků, zvlášť když používáte více referenčních obrázků. Stejná kvalita, žádné zvýšení ceny.
Pod povrchem: KV caching umožňuje modelu přeskočit redundantní výpočty na vašich referenčních obrázcích. Čím více odkazů použijete, tím větší je zrychlení. Inference je až 2x rychlejší pro multi-reference editace.
Také vydáváme FP8 kvantované váhy postavené s @NVIDIA_AI_PC Spusť Klein 9B s menším množstvím VRAM a rychlejším inferencem pro lokální i self-hosted nasazení.
173