В Алисе AI появился голосовой режим, который позволяет вести живой диалог, перебивая и вставляя короткие реплики на лету — как это происходит в человеческом общении.
Как это выглядит
В режиме «Поговорить» теперь доступно два голоса: знакомый голос Алисы AI и альтернативный женский — более поддерживающий. С ними можно болтать как с живым собеседником — вставляя короткие реплики, переспрашивая и перебивая. Чтобы достичь этого эффекта, сами ответы нейросети стали гораздо короче — их специально адаптировали для быстрой живой беседы.
В зависимости от того, как идет разговор, у Алисы AI могут появиться различные эмоции, а ещё по просьбе пользователя она может говорить медленнее или быстрее, а также перейти на шёпот или крик.
Как это работает
Внутри режима «Поговорить» — четыре модели, действующие по принципу каскада:
🔵 Детектор речи VAD — слушает речь и понимает, когда вы закончили говорить и пора отвечать (он также позволяет вам перебивать нейросеть, что невозможно в других режимах, и взаимодействовать с ней без триггер-слова «Алиса»
🔵 Распознавание речи — переводит речь в текст для восприятия Alice AI LLM;
🔵 Большая языковая модель — генерирует ответ на текстовый запрос, но так, что ответы лучше воспринимаются на слух и отличаются от обычных текстовых;
🔵 Синтез речи — произносит ответ нейросети голосом.
Работа каскада моделей позволяет убрать паузы, убивающие ощущение живого разговора.
Опробовать новый голосовой режим можно прямо сейчас — в приложении Алиса AI нужно нажать на иконку в левом верхнем углу, а затем выбрать режим «Поговорить».
Подписывайтесь 👉 @techno_yandex
