1/ Ce-ar fi dacă ți-aș spune că poți pre-antrena LLM-uri cu o combinație de GPU-uri de consum și de data center, pe internet cu lățime de bandă redusă, cu pierderi minime? Lucrare nouă: Pre-instruirea eterogenă pentru lățime de bandă redusă a LLM-urilor