Bawiłem się z Grok Voice API. Agenci głosowi w czasie rzeczywistym przez WebSocket, wbudowane dzwonienie i wyszukiwanie w sieci/X, 100+ języków. Agenci mogą to robić w trakcie rozmowy: [laugh] [sniff] [sigh] [gasp] [teasing-laugh] [inhale] [exhale] [chuckle] [sad-sigh] [giggle] [nervous-chuckle] [fake-laugh] [awkward-laugh] [exclaim] [whisper] [pause] Jest [fake-laugh] i [awkward-laugh]. Pięć głosów, niskie opóźnienie, gotowe do telekomunikacji.