DApp Store | Centrum Web3 pro události a hry

Populární témata

FLUX.2 [klein] 9B se právě dvakrát zrychlil v úpravě obrázků, zvlášť když používáte více referenčních obrázků. Stejná kvalita, žádné zvýšení ceny.

Pod povrchem: KV caching umožňuje modelu přeskočit redundantní výpočty na vašich referenčních obrázcích. Čím více odkazů použijete, tím větší je zrychlení. Inference je až 2x rychlejší pro multi-reference editace.

Také vydáváme FP8 kvantované váhy postavené s @NVIDIA_AI_PC Spusť Klein 9B s menším množstvím VRAM a rychlejším inferencem pro lokální i self-hosted nasazení.

173

Top

Hodnocení

Oblíbené