O Kimi K2.5 da Moonshot AI é o modelo #2 de pesos abertos, e agora está disponível em 8 provedores, cada um com preço e desempenho diferentes O Kimi K2.5 da @Kimi_Moonshot é um dos principais modelos de pesos abertos, com pontuação 47 no Índice de Inteligência de Análise Artificial, e seu forte uso de codificação e ferramentas o tornam um modelo popular para uso como agente de codificação. Estamos fazendo benchmarks de endpoints do modelo K2.5 de 8 provedores de API, com velocidades de tokens de saída variando em ~330 tokens/s entre os provedores mais rápidos e mais lentos – tornando a escolha do provedor um fator importante. Principais lições de benchmarking: ➤ ⚡ Velocidade: @basetenco atende ao ponto final mais rápido do Kimi K2.5 com 344 tokens de saída por segundo, seguido por @FireworksAI_HQ (273 t/s) e @novita_labs (52 t/s) ➤ ⏳ Latência: Acompanhamos TTFT (tempo até o primeiro token) e TTFAT (tempo até o token da primeira resposta). Para modelos de raciocínio, o TTFAT é a métrica chave, pois marca quando os usuários veem pela primeira vez resultados utilizáveis. Baseten lidera o TTFAT com 6,5s, à frente de Fireworks (7,7s) e Novita AI (39,4s). Para TTFT, Fireworks AI lidera com 0,36s, seguido por @togethercompute (0,49s) e Baseten (0,72s) ➤ 💲 Preços: @DeepInfra é o fornecedor de menor custo do Kimi K2.5, com preço de $0,45/M de tokens de entrada e $2,25/M de tokens de saída, 25% mais barato que os provedores mais caros ➤ 🪟 Janela de contexto: Todos os provedores suportam a janela completa de contexto de 256k tokens, exceto a Baseten, que suporta uma janela de contexto de 231k ➤ 🖼️ Multimodalidade: 7 dos 8 provedores suportam a capacidade nativa de entrada multimodal do Kimi K2.5, com o Baseten suportando apenas entrada de texto ➤ 🧰 Ferramentas suportadas: Chamada de ferramenta e modo JSON são suportados por todos os 8 provedores
Nós comparamos TTFT (tempo até o primeiro token) e TTFAT (token de tempo até a primeira resposta), sendo o TTFAT a principal métrica para modelos de raciocínio. Baseten lidera com 6,5s TTFAT, enquanto Fireworks AI lidera TTFT com 0,36s.
Compare os provedores para Kimi K2.5 (Reasoning) em 
2,6K