Qwen 3.5 27b, server llama.cpp, agente hermes, tailscale, 3090 Il stack rimane imbattuto Testando tutti i motori di inferenza, dopo di che vedremo se ci sono eventuali ottimizzazioni specifiche del modello che possiamo fare per farlo funzionare più velocemente Dopo di che magari giocheremo un po' con il serving w/ tinygrad giusto per divertimento