Инженеры платформ сталкиваются с универсальной задачей для обслуживания вывода: вам нужна низкая задержка, высокая пропускная способность и управляемые затраты. Решение нашей команды инженеров Vertex AI: GKE Inference Gateway. Посмотрите результаты→