我有兴趣为 Qwen3.5:27b/9b 重新进行后训练,特别是针对 @NousResearch 的 hermes-agent harness。 如果有人愿意让我使用 RTX PRO 6000 或其他具有 >VRAM 的设备(甚至是 AMD),我将很高兴为社区设置这个,并在 huggingface 上分享我的结果。 我们需要在 16 GB 和 24 GB 系统上改进代理智能。