OK, c'est parti. Même architecture, montée en échelle. 500 Mo de SRAM par puce. Jensen dit qu'il pourrait y avoir jusqu'à 25 % de votre centre de données qui pourrait être groq. Systèmes à 8 voies pour 4 Go de SRAM. Utilisez dynamo pour le décodage d'attention uniquement. Fonctionne sur Ethernet en mode spécial pour réduire la latence de moitié. Samsung LP4X. Expédition au 2H/3Q.