需求模型是为人类每分钟调用API几次而构建的……最大值 但数百万个代理从不休息,从不批处理,从不等待 他们持续进行推理,跨越每个时区,零容忍排队 AWS无法快速建立足够的数据中心来满足人类的需求。他们甚至没有考虑代理对该曲线的影响 更新模型的时间简直是轻描淡写。