Kasus penggunaan AI perbatasan mungkin menggunakan 100X lebih banyak token daripada kasus penggunaan perbatasan setahun yang lalu. Kita sudah melihat ledakan agen pengkodean yang melakukan proyek yang jauh lebih kompleks dan berjalan lebih lama, yang sudah menghabiskan kapasitas inferensi dalam jumlah gila. Dan ini adalah persentase kecil dari total pekerjaan pengetahuan. Arsitektur yang sama ini akan datang untuk sisa pekerjaan pengetahuan, di mana agen akan secara efektif memiliki komputer mereka sendiri untuk bekerja dan kemampuan untuk menulis dan menjalankan kode untuk banyak tugas, dan menyisir banyak data untuk melakukan pekerjaan mereka. Penggunaan token untuk agen-agen ini akan gila. Ini akan menjadi sangat menarik di tanah inferensi.