AVVISO: Se hai più macbook che supportano RDMA, puoi raggrupparli utilizzando @exolabs e far girare modelli da 30B+ a 70 tok/s tramite thunderbolt5. Il parallelismo tensoriale su hardware consumer è un problema risolto. Stai affittando GPU che sono peggiori del laptop sul tuo divano. 2X M4 Max (64GB ciascuno) che eseguono mlx-community/Qwen3-30B-A3B-4bit a 70 TPS