os modelos de demanda foram feitos para humanos atingindo APIs algumas vezes por minuto... Max Mas milhões de agentes nunca dormem, nunca lotam, nunca esperam Eles executam inferência continuamente, em todos os fusos horários, com tolerância zero para permanecer na linha A AWS não consegue construir data centers rápido o suficiente para a demanda humana. Eles nem estão avaliando o que os agentes fazem nessa curva Tempo para atualizar os modelos é um eufemismo