Si cela est vrai, cela validerait automatiquement deux choses - 1. Les TPU ont vraiment amené Nvidia à reconnaître que les accélérateurs AI personnalisés représentent une menace valide. Les coûts d'inférence sont réels et les GPU ont besoin d'un soutien supplémentaire pour rendre le service de bout en bout réalisable. 2. Plus important encore, cela agira comme ce coup d'adrénaline pour chaque entreprise investissant dans ses propres puces et autres accélérateurs AI. Si c'est vrai, il sera vraiment intéressant de voir comment CUDA s'applique au paradigme du flux de données. J'attends avec impatience !!