Ich habe ein 1T-Parameter-Modell, das lokal auf meinem MacBook Pro läuft. LLM: Kimi K2.5 1.026.408.232.448 Parameter (~1.026T) Hardware: M2 Max MacBook Pro (2023) mit 96 GB einheitlichem Speicher Läuft auf MLX mit einem Flash-SSD-Streaming-Pfad + lokalem Patchen. Dies ist ein experimentelles Setup und ich habe die Geschwindigkeit noch nicht optimiert, aber es ist stabil genug, dass ich begonnen habe, es in einer autoresearch-ähnlichen Schleife zu testen. #LocalAI #MLX #MoE