Comment un agent vocal peut-il savoir quand vous l'interrompez réellement ?
Le VAD est trop sensible : des rires, des "mm-hmm" ou un éternuement ne devraient pas arrêter l'agent.
Nous avons entraîné un modèle audio pour la gestion adaptative des interruptions afin que les agents puissent distinguer les vraies interruptions du bruit.
L'API de synthèse vocale de Grok est maintenant disponible dans LiveKit Inference.
Voix naturelles et expressives avec un streaming à faible latence. Multilingue en plus de 20 langues. Prête à l'emploi pour la téléphonie et la production.
Une clé API. Pas de configuration supplémentaire.
→
L'API de synthèse vocale de Grok est maintenant disponible.
Commencez à créer avec des voix naturelles et des contrôles expressifs pour donner vie à vos applications.
LiveKit fête ses 5 ans aujourd'hui.
Ce qui a commencé comme un projet open source alimente désormais plus de 300 000 développeurs, plus de 5 000 clients et des milliards d'appels à travers la voix, la vidéo et les agents IA physiques.
Prochain objectif : construire l'infrastructure pour l'informatique pilotée par la voix.
Merci à notre communauté pour ces 5 années incroyables.