Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Il Kimi K2.5 di Moonshot AI è il modello open weights n. 2 ed è ora disponibile presso 8 fornitori, ognuno con prezzi e prestazioni differenti.
Il Kimi K2.5 di @Kimi_Moonshot è uno dei modelli open weights leader, con un punteggio di 47 nell'Artificial Analysis Intelligence Index, e il suo forte utilizzo di codifica e strumenti lo rende un modello popolare da utilizzare come agente di codifica. Stiamo confrontando gli endpoint del modello K2.5 di 8 fornitori API, con velocità di output dei token che variano di circa 330 token/s tra i fornitori più veloci e quelli più lenti - rendendo la scelta del fornitore un fattore importante.
Punti chiave del benchmarking:
➤ ⚡ Velocità: @basetenco offre l'endpoint Kimi K2.5 più veloce a 344 token di output al secondo, seguito da @FireworksAI_HQ (273 t/s) e @novita_labs (52 t/s)
➤ ⏳ Latenza: Monitoriamo TTFT (tempo per il primo token) e TTFAT (tempo per il primo token di risposta). Per i modelli di ragionamento, TTFAT è la metrica chiave poiché segna quando gli utenti vedono per la prima volta un output utilizzabile. Baseten guida su TTFAT a 6.5s, davanti a Fireworks (7.7s) e Novita AI (39.4s). Per TTFT, Fireworks AI guida a 0.36s, seguito da @togethercompute (0.49s) e Baseten (0.72s)
➤ 💲 Prezzi: @DeepInfra è il fornitore a costo più basso di Kimi K2.5, con un prezzo di $0.45/M token di input e $2.25/M token di output, il 25% più economico rispetto ai fornitori più costosi.
➤ 🪟 Finestra di contesto: Tutti i fornitori supportano la finestra di contesto completa di 256k token, tranne Baseten, che supporta una finestra di contesto di 231k token.
➤ 🖼️ Multimodalità: 7 dei 8 fornitori supportano la capacità di input multimodale nativa del Kimi K2.5, con Baseten che supporta solo input testuali.
➤ 🧰 Strumenti supportati: La chiamata agli strumenti e la modalità JSON sono supportate da tutti e 8 i fornitori.

Confrontiamo TTFT (tempo per il primo token) e TTFAT (tempo per il primo token di risposta), con TTFAT che è il principale indicatore per i modelli di ragionamento. Baseten guida con 6,5s di TTFAT, mentre Fireworks AI guida il TTFT con 0,36s.

Confronta i fornitori per Kimi K2.5 (Ragionamento) a
2,57K
Principali
Ranking
Preferiti
