В недавнем посте я указал на этот основополагающий сдвиг, который происходит в мире агентного ИИ, и как соотношение CPU:GPU изменится с текущего состояния. Сегодня оно больше похоже на 1:2 или 1:4, в будущем это может измениться на 2:1. Некоторые агентные рабочие нагрузки могут полностью выполняться на CPU. GPU не требуется. Мир дата-центров только начинает осознавать это с недавним взрывом агентного ИИ, но потребуется 12-18 месяцев, чтобы это проявилось в отрасли.