1/ ¿Y si te dijera que puedes preentrenar LLMs con una mezcla de GPUs de consumo y de centro de datos, sobre internet de bajo ancho de banda con una pérdida mínima? Nuevo artículo: Pre-entrenamiento heterogéneo de bajo ancho de banda de LLMs