Totalmente equivocado. Los tamaños de modelo van a crecer mucho en 2026 como resultado de mundos de mayor escalado en racks Nvidia (y también en los de Google TPU), pasando de B200 con 1,4 TB por mundo de escalado de 8 chips a GB300 con 20 TB por mundo de ampliación.
expatanon
expatanon18 mar, 03:04
Altman admitió que los modelos de transformadores han chocado contra el muro. La mayoría de las mejoras en los últimos 9 meses se deben más a las herramientas alrededor del modelo que a los modelos en sí. En otras palabras, esta tecnología está madurando rápidamente sin señales de otro salto.
Las impresionantes inversiones en centros de datos de 2024/2025 están empezando a entrar en marcha ahora, con hardware mucho mejor que el que los modelos de la generación actual están optimizados para inferencia.
112