Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O Kimi K2.5 da Moonshot AI é o modelo #2 de pesos abertos, e agora está disponível em 8 provedores, cada um com preço e desempenho diferentes
O Kimi K2.5 da @Kimi_Moonshot é um dos principais modelos de pesos abertos, com pontuação 47 no Índice de Inteligência de Análise Artificial, e seu forte uso de codificação e ferramentas o tornam um modelo popular para uso como agente de codificação. Estamos fazendo benchmarks de endpoints do modelo K2.5 de 8 provedores de API, com velocidades de tokens de saída variando em ~330 tokens/s entre os provedores mais rápidos e mais lentos – tornando a escolha do provedor um fator importante.
Principais lições de benchmarking:
➤ ⚡ Velocidade: @basetenco atende ao ponto final mais rápido do Kimi K2.5 com 344 tokens de saída por segundo, seguido por @FireworksAI_HQ (273 t/s) e @novita_labs (52 t/s)
➤ ⏳ Latência: Acompanhamos TTFT (tempo até o primeiro token) e TTFAT (tempo até o token da primeira resposta). Para modelos de raciocínio, o TTFAT é a métrica chave, pois marca quando os usuários veem pela primeira vez resultados utilizáveis. Baseten lidera o TTFAT com 6,5s, à frente de Fireworks (7,7s) e Novita AI (39,4s). Para TTFT, Fireworks AI lidera com 0,36s, seguido por @togethercompute (0,49s) e Baseten (0,72s)
➤ 💲 Preços: @DeepInfra é o fornecedor de menor custo do Kimi K2.5, com preço de $0,45/M de tokens de entrada e $2,25/M de tokens de saída, 25% mais barato que os provedores mais caros
➤ 🪟 Janela de contexto: Todos os provedores suportam a janela completa de contexto de 256k tokens, exceto a Baseten, que suporta uma janela de contexto de 231k
➤ 🖼️ Multimodalidade: 7 dos 8 provedores suportam a capacidade nativa de entrada multimodal do Kimi K2.5, com o Baseten suportando apenas entrada de texto
➤ 🧰 Ferramentas suportadas: Chamada de ferramenta e modo JSON são suportados por todos os 8 provedores

Nós comparamos TTFT (tempo até o primeiro token) e TTFAT (token de tempo até a primeira resposta), sendo o TTFAT a principal métrica para modelos de raciocínio. Baseten lidera com 6,5s TTFAT, enquanto Fireworks AI lidera TTFT com 0,36s.

Compare os provedores para Kimi K2.5 (Reasoning) em
2,6K
Melhores
Classificação
Favoritos
