PSA: Pokud máte více MacBooků podporujících RDMA, můžete je seskupit pomocí @exolabs a provozovat modely s 30B+ rychlostí 70 tok/s přes thunderbolt5. Tenzorový paralelismus na spotřebitelském hardwaru je vyřešený problém. Pronajímáte si GPU, které jsou horší než notebook na vašem gauči. 2X M4 Max (64GB každý) běžící mlx-community/Qwen3-30B-A3B-4bit @ 70 TPS