Lors de la GTC de Nvidia, Jensen qualifie cela de "probablement le graphique le plus important pour l'avenir des usines d'IA". L'axe Y est "Débit" (volume total) tandis que l'axe X est "Vitesse des tokens" (plus de tokens par seconde = plus d'interactivité pour un utilisateur + plus de contexte + plus de raisonnement). Les entreprises commercialisent et fixent le prix des offres de tokens en fonction de ces deux variables, qui sont en tension. Un niveau gratuit est généralement à haut débit mais avec une vitesse de token plus faible. Pendant ce temps, le niveau le plus cher aurait un débit plus faible mais des tokens de grande valeur (par exemple, recherche, codage). Le défi de Nvidia est de construire des systèmes qui élèvent toute la ligne vers le haut et vers la droite. Jensen dit que l'architecture Vera Rubin améliore l'opportunité de revenus de 5x par rapport à Blackwell. Ensuite, si vous ajoutez Groq à Vera Rubin, cette opportunité de revenus est multipliée par 10 par rapport à Blackwell (Groq utile pour les tokens de plus grande valeur).