Агенты ИИ не ведут себя как другие рабочие нагрузки ИИ. Они работают в течение длительных сессий, вызывают несколько моделей, внезапно увеличиваются в нагрузке и простаивают между шагами. Это требует изменения в том, как мы думаем о предоставлении GPU. Облака, которые были созданы для вывода и обучения, делают экономику агентов несостоятельной. И что-то должно измениться. Узнайте больше в нашем блоге: Инфраструктура агентов ИИ — рабочая нагрузка GPU в облаке, о которой никто не планировал.