На GTC от Nvidia Дженсен называет это "вероятно, самым важным графиком для будущего фабрик ИИ". Ось Y – это "Пропускная способность" (общий объем), а ось X – это "Скорость токенов" (больше токенов в секунду = больше интерактивности для пользователя + больше контекста + больше рассуждений). Компании оценивают и устанавливают цены на токены по этим двум переменным, которые находятся в напряжении. Бесплатный уровень обычно имеет высокую пропускную способность, но низкую скорость токенов. В то же время самый дорогой уровень будет иметь более низкую пропускную способность, но токены высокой ценности (например, исследования, программирование). Задача Nvidia заключается в том, чтобы создать системы, которые поднимут всю линию вверх и вправо. Дженсен говорит, что архитектура Веры Рубин увеличивает возможности дохода в 5 раз по сравнению с Blackwell. Затем, если вы добавите Groq к Вере Рубин, эта возможность дохода увеличится в 10 раз по сравнению с Blackwell (Groq полезен для токенов более высокой ценности).