Các tác nhân AI không hoạt động giống như các khối lượng công việc AI khác. Chúng chạy các phiên dài, gọi nhiều mô hình, bùng nổ một cách không thể đoán trước và nhàn rỗi giữa các bước. Điều này đòi hỏi một sự thay đổi trong cách chúng ta nghĩ về việc cung cấp GPU. Các đám mây được xây dựng cho việc suy diễn và đào tạo, khiến kinh tế của các tác nhân trở nên không bền vững. Và một điều gì đó cần phải thay đổi. Tìm hiểu thêm trong blog của chúng tôi: Cơ sở hạ tầng Tác nhân AI — Khối lượng công việc GPU trên đám mây mà không ai dự tính.