Moonshot AIのKimi K2.5は#2オープンウェイトモデルで、現在8社で販売されていますが、それぞれ価格と性能が異なります @Kimi_MoonshotのKimi K2.5は、人工分析知能指数で47点を獲得し、優れたコーディングとツール活用によりコーディングエージェントとして人気のあるモデルとなっています。私たちは8つのAPIプロバイダーからK2.5モデルのエンドポイントをベンチマークしており、出力トークン速度は最速プロバイダー間で約330トークン/秒の差があるため、プロバイダー選択が重要な要素となっています。 主なベンチマークポイント: † ⚡ 速度:@basetenco Kimi K2.5エンドポイントで最速の出力トークンを344トークン/秒で処理し、次いで@FireworksAI_HQ(273 t/s)と@novita_labs(52 t/s)が続きます。 † ⏳ レイテンシ:TTFT(最初のトークンまでの時間)とTTFAT(最初の回答トークンまでの時間)を追跡しています。推論モデルにおいて、TTFATはユーザーが初めて利用可能な出力を目にした時点を示す主要な指標です。バセンはTTFATで6.5秒でリードし、ファイアワークス(7.7秒)とノヴィタAI(39.4秒)を上回っています。TTFTではFireworks AIが0.36秒でリードし、次いで@togethercompute(0.49秒)、Baseten(0.72秒)が続きます † 💲 価格設定:@DeepInfraはKimi K2.5の最も低コストのプロバイダーであり、入力トークンが$0.45/M、出力トークンが$2.25/Mで、最も高価なプロバイダーより25%安いです † 🪟 コンテキストウィンドウ:Basetenを除くすべてのプロバイダーが256kトークンコンテキストウィンドウをサポートしており、Basetenは231kコンテキストウィンドウをサポートしています † 🖼️ マルチモーダリティ:8社中7社がKimi K2.5のネイティブマルチモーダリティ入力機能をサポートしており、Basetenはテキスト入力のみをサポートしています † 🧰 サポートツール:ツールコールおよびJSONモードは8つのプロバイダーすべてでサポートされています
TTFT(最初のトークンまでの時間)とTTFAT(最初の回答トークンまでの時間)をベンチマークし、推論モデルの主要な指標はTTFATです。BasetenはTTFATで6.5秒、Fireworks AIはTTFTを0.36秒でリードしています。
Kimi K2.5(Reasoning)の提供者を比較してください。
2.56K