Fra Nvidias GTC kaller Jensen dette «sannsynligvis det viktigste diagrammet for fremtiden for AI-fabrikker». Y-aksen er «gjennomstrømning» (totalt volum), mens X-aksen er «Token Speed» (flere tokens per sekund = mer interaktivitet for en bruker + mer kontekst + mer resonnement). Bedrifter markedsfører og priser token-tilbud basert på disse to variablene, som står i konflikt. Et gratis nivå har vanligvis høy gjennomstrømning, men lavere tokenhastighet. I mellomtiden vil det dyreste nivået ha lavere througput, men høyverdige tokens (f.eks. forskning, koding) Nvidias utfordring er å bygge systemer som løfter hele serien opp og mot høyre. Jensen sier at Vera Rubin-arkitekturen forbedrer inntektsmulighetene fem ganger sammenlignet med Blackwell. Hvis du legger til Groq i Vera Rubin, øker den inntektsmuligheten 10 ganger sammenlignet med Blackwell (Groq er nyttig for de mer verdifulle tokenene).