FLUX.2 [klein] 9B щойно став у 2 рази швидшим у редагуванні зображень, особливо коли використовуєш кілька референтних зображень. Така ж якість, без підвищення ціни.
Під капотом: KV-кешинг дозволяє моделі пропускати дублювання обчислень на ваших референтних зображеннях. Чим більше посилань ви використовуєте, тим більший прискорення. Інференція до 2x+ швидша для редагування з кількома посиланнями.
Ми також випускаємо квантизовані ваги FP8, створені з @NVIDIA_AI_PC Запустіть Klein 9B з меншою кількістю VRAM і швидшим висновком для локальних і власних розгортань.
192