Desde el GTC de Nvidia, Jensen llama a esto "probablemente el gráfico más importante para el futuro de las fábricas de IA". El eje Y es "Rendimiento" (volumen total) mientras que el eje X es "Velocidad de Token" (más tokens por segundo = más interactividad para un usuario + más contexto + más razonamiento). Las empresas comercializan y fijan precios de las ofertas de tokens en base a esas dos variables, que están en tensión. Un nivel gratuito típicamente tiene un alto rendimiento pero una menor velocidad de token. Mientras tanto, el nivel más caro tendría un menor rendimiento pero tokens de alto valor (por ejemplo, investigación, codificación). El desafío de Nvidia es construir sistemas que eleven toda la línea hacia arriba y hacia la derecha. Jensen dice que la arquitectura de Vera Rubin mejora la oportunidad de ingresos 5 veces en comparación con Blackwell. Luego, si añades Groq a Vera Rubin, esa oportunidad de ingresos aumenta 10 veces en comparación con Blackwell (Groq es útil para los tokens de mayor valor).