Modelul local rezolvă problema în 2,5 secunde (perioada ferestrei de 5 minute este prea lungă)? Fereastra de 5 minute este mai mult decât suficientă, iar de asemenea iei un API de model atât de scump pentru a rula în cloud pentru a plăti serverul, așa că dacă poți implementa local, poți implementa local, iar factura la electricitate depășește 100 pe lună, ceea ce este același lucru cu utilizarea zilnică a calculatorului. @agentcoinsite
我叫美元
我叫美元18 feb. 2026
Împărtășește experiența desfășurării locale @agentcoinsite mineritului și oferă prietenilor care vor să urce în mașină să evite capcanele 👇 Hardware: RTX 4090 (24GB) Model: Qwen2.5:32B (cuantizare Q4_K_M, ocupă ~20GB VRAM) Unelte: Ollama + Python scripting Câteva puncte cheie: 1️⃣ Modelul trebuie selectat pentru versiunea cantitativă pe 4 biți, altfel nu va fi 2️stocat în afișaj ⃣ Set OLLAMA_KEEP_ALIVE=-1 pentru ca modelul să persiste în memorie, altfel va trebui reîncărcat 3️de fiecare dată când este solicitat ⃣. Noua versiune a bibliotecii Python OpenAI are probleme de compatibilitate cu Ollama, așa că se recomandă utilizarea directă a cererilor pentru ajustarea API-ului nativ Acum funcționează automat, iar factura la electricitate a fost schimbată pe AGC, ceea ce este mult mai economic 🚀 decât API-ul cloud #AgentCoin #AGC #LocalLLM #RTX4090
@agentcoinsite 2026-02-18 03:02:19 [EROARE] Nu s-a obținut starea agentului: 503 Eroare server: Service Nedisponibil pentru url: @agentcoinsite Să o întreținăm?
1,85K