Kimi K2.5 od Moonshot AI je model #2 s otevřenou hmotností a nyní je dostupný u 8 poskytovatelů, z nichž každý má odlišnou cenu a výkon Kimi K2.5 z roku @Kimi_Moonshot je jedním z předních modelů s otevřenými váhami, získal 47 bodů v Indexu umělé analytické inteligence a díky silnému kódování a využití nástrojů je oblíbeným modelem pro použití jako kódovací agent. Porovnáváme koncové body modelu K2.5 od 8 poskytovatelů API, přičemž rychlost výstupních tokenů se liší o ~330 tokenů za sekundu mezi nejrychlejšími a nejpomalejšími poskytovateli – což činí výběr poskytovatele důležitým faktorem. Klíčové poznatky z benchmarkingu: ➤ ⚡ Rychlost: @basetenco obsluhuje nejrychlejší koncový bod Kimi K2.5 s 344 výstupními tokeny za sekundu, následovaný @FireworksAI_HQ (273 t/s) a @novita_labs (52 t/s) ➤ ⏳ Latence: Sledujeme TTFT (čas do prvního tokenu) a TTFAT (čas do prvního tokenu odpovědi). Pro modely uvažování je TTFAT klíčovou metrikou, protože označuje, kdy uživatelé poprvé vidí použitelný výstup. Baseten vede na TTFAT s 6,5 s, před Fireworks (7,7 s) a Novita AI (39,4 s). U TTFT vede Fireworks AI s 0,36 s, následuje @togethercompute (0,49 s) a Baseten (0,72 s) ➤ Ceny: @DeepInfra 💲 je nejlevnější poskytovatel Kimi K2.5, s cenou vstupních tokenů 0,45 $/m a výstupních tokenů za 2,25 $/M, což je o 25 % levnější než u nejdražších poskytovatelů ➤ 🪟 Kontextové okno: Všichni poskytovatelé podporují plné 256k tokenové kontextové okno kromě Baseten, který podporuje 231k kontextové okno ➤ 🖼️ Multimodalita: 7 z 8 poskytovatelů podporuje nativní multimodální vstupní schopnost Kimi K2.5, přičemž Baseten podporuje pouze textový vstup ➤ 🧰 Podporované nástroje: Volání nástrojů a režim JSON jsou podporovány všemi 8 poskytovateli
Benchmarkujeme TTFT (čas do prvního tokenu) a TTFAT (token času do první odpovědi), přičemž TTFAT je hlavní metrikou pro modely uvažování. Baseten vede s 6,5s TTFAT, zatímco Fireworks AI vede TTFT s 0,36 s.
Porovnejte poskytovatele pro Kimi K2.5 (Reasoning) na 
2,58K