Kimi K2.5 de la Moonshot AI este modelul #2 pentru greutăți deschise și este acum disponibil la 8 furnizori, fiecare cu prețuri și performanțe diferite Kimi K2.5 de la @Kimi_Moonshot este unul dintre cele mai importante modele open weights, obținând un scor de 47 la Artificial Analysis Intelligence Index, iar codarea sa puternică și utilizarea uneltelor îl fac un model popular pentru utilizare ca agent de codificare. Testăm endpoint-urile modelului K2.5 de la 8 furnizori API, cu viteze de ieșire ale tokenurilor care variază cu ~330 token/s între cei mai rapizi și cei mai lenți furnizori – ceea ce face ca alegerea furnizorului să fie un factor important. Concluzii cheie de benchmarking: ➤ ⚡ Viteză: @basetenco deservește cel mai rapid punct final Kimi K2.5 cu 344 tokenuri de ieșire pe secundă, urmat de @FireworksAI_HQ (273 t/s) și @novita_labs (52 t/s) ➤ ⏳ Latență: Urmărim TTFT (timpul până la primul token) și TTFAT (timpul până la primul token de răspuns). Pentru modelele de raționament, TTFAT este metrica cheie, deoarece marchează când utilizatorii văd pentru prima dată rezultate utilizabile. Baseten conduce la TTFAT cu 6,5s, înaintea lui Fireworks (7,7s) și Novita AI (39,4s). Pentru TTFT, Fireworks AI conduce cu 0,36s, urmat de @togethercompute (0,49s) și Baseten (0,72s) ➤ 💲 Prețuri: @DeepInfra este cel mai ieftin furnizor de Kimi K2.5, cu un preț de 0,45$/M tokenuri de intrare și $2,25/M tokens de output, cu 25% mai ieftin decât cei mai scumpi furnizori ➤ 🪟 Fereastra de context: Toți furnizorii suportă întreaga fereastră de context de 256k token, cu excepția Baseten, care suportă o fereastră de context de 231k ➤ 🖼️ Multimodalitate: 7 dintre cei 8 furnizori suportă capacitatea nativă de intrare multimodală a Kimi K2.5, Baseten suportând doar introducerea textului ➤ 🧰 Instrumente suportate: Apelarea uneltelor și modul JSON sunt suportate de toți cei 8 furnizori
Comparăm TTFT (timp până la primul token) și TTFAT (timp până la primul token de răspuns), TTFAT fiind metrica principală pentru modelele de raționament. Baseten conduce la 6,5s TTFAT, în timp ce Fireworks AI conduce la TTFT cu 0,36s.
Compară furnizorii pentru Kimi K2.5 (Raționament) la 
2,56K