Moonshot AIs Kimi K2.5 er den #2 åpne vektmodellen, og er nå tilgjengelig hos 8 leverandører, hver med ulik pris og ytelse Kimi K2.5 fra @Kimi_Moonshot er en av de ledende åpne vektmodellene, med 47 poeng på Artificial Analysis Intelligence Index, og dens sterke koding og bruk av verktøy gjør den til en populær modell for bruk som kodingsagent. Vi benchmarker K2.5-modellendepunkter fra 8 API-leverandører, med hastigheter på outputtokens som varierer med ~330 tokens/s mellom de raskeste og tregeste leverandørene – noe som gjør valg av leverandør til en viktig faktor. Viktige benchmarking-innsikter: ➤ ⚡ Hastighet: @basetenco betjener det raskeste Kimi K2.5-endepunktet med 344 utgangstokens per sekund, etterfulgt av @FireworksAI_HQ (273 t/s) og @novita_labs (52 t/s) ➤ ⏳ Latens: Vi sporer TTFT (tid til første token) og TTFAT (tid til første svar-token). For resonnementmodeller er TTFAT nøkkelmålingen, da det markerer når brukerne først ser brukbart resultat. Baseten leder på TTFAT med 6,5 sekunder, foran Fireworks (7,7 sekunder) og Novita AI (39,4 sekunder). For TTFT leder Fireworks AI med 0,36 sekunder, etterfulgt av @togethercompute (0,49 sekunder) og Baseten (0,72 sekunder) ➤ 💲 Pris: @DeepInfra er den rimeligste leverandøren av Kimi K2.5, priset til $0,45/M input-tokens og $2,25/M outputtokens, 25 % billigere enn de dyreste leverandørene ➤ 🪟 Kontekstvindu: Alle leverandører støtter hele 256k token-kontekstvinduet unntatt Baseten, som støtter et 231k kontekstvindu ➤ 🖼️ Multimodalitet: 7 av de 8 leverandørene støtter Kimi K2.5s innebygde multimodale inndatafunksjon, mens Baseten kun støtter tekstinput ➤ 🧰 Støttede verktøy: Verktøykall og JSON-modus støttes av alle 8 leverandører
Vi benchmarker TTFT (time to first token) og TTFAT (time to first answer token), hvor TTFAT er hovedmålet for resonnementmodeller. Baseten leder med 6,5 sekunder TTFAT, mens Fireworks AI leder TTFT med 0,36 sekunder.
Sammenlign leverandører for Kimi K2.5 (Reasoning) på 
2,58K