Ukazuje se, že na Macu lze spustit obrovskou kombinaci expertů, aniž byste celý model vložili do RAM, tím, že streamujete podmnožinu expertních vah ze SSD pro každý generovaný token – a lidé stále nacházejí způsoby, jak provozovat větší modely Kimi 2.5 je 1T, ale aktivní jen 32B, takže se vejde 96GB