DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Kimi K2.5 de Moonshot AI es el modelo de pesos abiertos número 2, y ahora está disponible en 8 proveedores, cada uno con diferentes precios y rendimiento. Kimi K2.5 de @Kimi_Moonshot es uno de los modelos de pesos abiertos líderes, con una puntuación de 47 en el Índice de Inteligencia de Análisis Artificial, y su fuerte capacidad de codificación y uso de herramientas lo convierte en un modelo popular para ser utilizado como agente de codificación. Estamos evaluando los puntos finales del modelo K2.5 de 8 proveedores de API, con velocidades de tokens de salida que varían en ~330 tokens/s entre los proveedores más rápidos y más lentos, lo que hace que la elección del proveedor sea un factor importante. Puntos clave de la evaluación: ➤ ⚡ Velocidad: @basetenco ofrece el punto final Kimi K2.5 más rápido a 344 tokens de salida por segundo, seguido por @FireworksAI_HQ (273 t/s) y @novita_labs (52 t/s). ➤ ⏳ Latencia: Seguimos TTFT (tiempo hasta el primer token) y TTFAT (tiempo hasta el primer token de respuesta). Para modelos de razonamiento, TTFAT es la métrica clave ya que marca cuando los usuarios ven por primera vez una salida utilizable. Baseten lidera en TTFAT con 6.5s, por delante de Fireworks (7.7s) y Novita AI (39.4s). Para TTFT, Fireworks AI lidera con 0.36s, seguido por @togethercompute (0.49s) y Baseten (0.72s). ➤ 💲 Precios: @DeepInfra es el proveedor de Kimi K2.5 de menor costo, con un precio de $0.45/M tokens de entrada y $2.25/M tokens de salida, un 25% más barato que los proveedores más caros. ➤ 🪟 Ventana de contexto: Todos los proveedores soportan la ventana de contexto completa de 256k tokens, excepto Baseten, que soporta una ventana de contexto de 231k tokens. ➤ 🖼️ Multimodalidad: 7 de los 8 proveedores soportan la capacidad de entrada nativa de multimodalidad de Kimi K2.5, con Baseten soportando solo entrada de texto. ➤ 🧰 Herramientas soportadas: La llamada a herramientas y el modo JSON son soportados por los 8 proveedores.

Comparamos TTFT (tiempo hasta el primer token) y TTFAT (tiempo hasta el primer token de respuesta), siendo TTFAT la métrica principal para los modelos de razonamiento. Baseten lidera con 6.5s de TTFAT, mientras que Fireworks AI lidera en TTFT con 0.36s.

Compara proveedores para Kimi K2.5 (Razonamiento) en

2,6K

Parte superior

Clasificación

Favoritos