Qwen 3.5 27b, llama.cpp Server, hermes Agent, tailscale, 3090 Der Stack bleibt unbesiegt Testen aller Inferenz-Engines, danach sehen, ob es modell-spezifische Anpassungen gibt, die wir vornehmen können, um es schneller zum Laufen zu bringen Danach vielleicht ein bisschen mit dem Servieren mit tinygrad herumspielen, nur zum Spaß