Ho giocato con il Grok Voice API. Agenti vocali in tempo reale tramite WebSocket, chiamate agli strumenti e ricerca web/X integrate, oltre 100 lingue. Gli agenti possono fare questo durante la conversazione: [laugh] [sniff] [sigh] [gasp] [teasing-laugh] [inhale] [exhale] [chuckle] [sad-sigh] [giggle] [nervous-chuckle] [fake-laugh] [awkward-laugh] [exclaim] [whisper] [pause] C'è un [fake-laugh] e un [awkward-laugh]. Cinque voci, bassa latenza, pronte per la telefonia.