Hoe kan een spraakagent vertellen wanneer je het daadwerkelijk onderbreekt?
VAD is te gevoelig—lachen, "mm-hmm," of een nies zou de agent niet moeten stoppen.
We hebben een audiomodel getraind voor adaptieve onderbrekingsafhandeling, zodat agents echte onderbrekingen van ruis kunnen onderscheiden.
Grok's Text-to-Speech API is nu beschikbaar in LiveKit Inference.
Natuurlijke, expressieve stemmen met low-latency streaming. Meertalig in meer dan 20 talen. Telefoon- en productieklare oplossing direct uit de doos.
Één API-sleutel. Geen extra setup.
→
LiveKit bestaat vandaag 5 jaar.
Wat begon als een open source project, ondersteunt nu meer dan 300k ontwikkelaars, 5k klanten en miljarden oproepen via spraak, video en fysieke AI-agenten.
Volgende stap: het bouwen van de infrastructuur voor spraakgestuurde computing.
Bedankt aan onze gemeenschap voor 5 geweldige jaren.