модели спроса были созданы для людей, обращающихся к API несколько раз в минуту... максимум но миллионы агентов никогда не спят, никогда не объединяются, никогда не ждут они выполняют выводы непрерывно, по всем временным зонам, с нулевой терпимостью к ожиданию в очереди AWS не может построить дата-центры достаточно быстро для человеческого спроса. они даже не учитывают, что агенты делают с этой кривой время обновления моделей — это преуменьшение