我们正在与 @cerebras 合作,构建最快的推理。 即将推出于 Amazon Bedrock,我们通过连接 AWS Trainium3 进行计算密集型预填充与 Cerebras CS-3 来提供比今天可用的快一个数量级的推理性能。 了解更多关于此次合作的信息。