Grok Voice API'si ile uğraşıyorum. WebSocket üzerinden gerçek zamanlı ses ajanları, araç araması ve web/X araması dahil, 100+ dil. Ajanlar konuşma sırasında şunları yapabilir: [gülüyor] [koklama] [iç çekiş] [nefes kesilmesi] [alaycı-kahkaha] [nefes alır] [nefes verir] [kıkırdama] [hüzünlü iç çekiş] [kıkırdama] [gergin kahkaha] [sahte kahkaha] [garip kahkaha] [haykırış] [fısıltı] [duraklama] Bir [sahte-kahkaha] ve bir [garip kahkaha] var. Beş ses, düşük gecikme, telefona hazır.