Dalla GTC di Nvidia, Jensen chiama questo "probabilmente il grafico più importante per il futuro delle fabbriche di AI". L'asse Y è "Throughput" (volume totale) mentre l'asse X è "Token Speed" (più token al secondo = più interattività per un utente + più contesto + più ragionamento). Le aziende commercializzano e prezzano le offerte di token su queste due variabili, che sono in tensione. Un livello gratuito è tipicamente ad alto throughput ma con una velocità di token inferiore. Nel frattempo, il livello più costoso avrebbe un throughput inferiore ma token di alto valore (ad es. ricerca, codifica). La sfida di Nvidia è costruire sistemi che sollevino l'intera linea verso l'alto e a destra. Jensen afferma che l'architettura Vera Rubin migliora l'opportunità di guadagno di 5 volte rispetto a Blackwell. Poi, se aggiungi Groq a Vera Rubin, quell'opportunità di guadagno aumenta di 10 volte rispetto a Blackwell (Groq utile per i token di valore più elevato).