Я экспериментировал с Grok Voice API. Голосовые агенты в реальном времени через WebSocket, встроенные инструменты для вызовов и веб/поиска, более 100 языков. Агенты могут делать это в середине разговора: [смеяться] [шмыгать носом] [вздыхать] [вздыхать от удивления] [поддразнивающе смеяться] [вдыхать] [выдыхать] [хихикать] [грустно вздыхать] [покатываться со смеху] [нервно хихикать] [делать вид, что смеется] [неловко смеяться] [восклицать] [шептать] [пауза] Есть [делать вид, что смеется] и [неловко смеяться]. Пять голосов, низкая задержка, готовность к телефонной связи.