De grens AI-toepassingen gebruiken waarschijnlijk ongeveer 100 keer meer tokens dan de grenstoepassingen een jaar geleden. We zien al de explosie van coderingsagenten die veel complexere en langdurigere projecten uitvoeren, wat al een insane hoeveelheid inferentiecapaciteit verbruikt. En dit is een klein percentage van het totale kenniswerk. Dezezelfde architectuur staat op het punt om voor de rest van het kenniswerk te komen, waar agenten effectief hun eigen computer zullen hebben om mee te werken en de mogelijkheid om code te schrijven en uit te voeren voor veel taken, en door enorme hoeveelheden data te gaan om hun werk te doen. Het tokenverbruik voor deze agenten zal insane zijn. Het gaat heel interessant worden in de inferentiewereld.