Как голосовой агент может определить, когда вы действительно его прерываете?
VAD слишком чувствителен — смех, "мм-хм," или чихание не должны останавливать агента.
Мы обучили аудиомодель для адаптивного управления прерываниями, чтобы агенты могли различать реальные прерывания и шум.
API синтеза речи Grok теперь доступен в LiveKit Inference.
Естественные, выразительные голоса с низкой задержкой. Многоязычный, поддерживающий более 20 языков. Готов к использованию в телефонии и производстве прямо из коробки.
Один API-ключ. Никакой дополнительной настройки.
→
LiveKit сегодня исполняется 5 лет.
То, что начиналось как проект с открытым исходным кодом, теперь поддерживает более 300 тыс. разработчиков, более 5 тыс. клиентов и миллиарды вызовов через голос, видео и физических AI-агентов.
Далее: создание инфраструктуры для вычислений на основе голоса.
Спасибо нашему сообществу за 5 невероятных лет.