July 03, 13:10

Forwarded from :

В Алисе AI появился голосовой режим, который позволяет вести живой диалог, перебивая и вставляя короткие реплики на лету — как это происходит в человеческом общении.

Как это выглядит

В режиме «Поговорить» теперь доступно два голоса: знакомый голос Алисы AI и альтернативный женский — более поддерживающий. С ними можно болтать как с живым собеседником — вставляя короткие реплики, переспрашивая и перебивая. Чтобы достичь этого эффекта, сами ответы нейросети стали гораздо короче — их специально адаптировали для быстрой живой беседы.

В зависимости от того, как идет разговор, у Алисы AI могут появиться различные эмоции, а ещё по просьбе пользователя она может говорить медленнее или быстрее, а также перейти на шёпот или крик.

Как это работает

Внутри режима «Поговорить» — четыре модели, действующие по принципу каскада:

🔵 Детектор речи VAD — слушает речь и понимает, когда вы закончили говорить и пора отвечать (он также позволяет вам перебивать нейросеть, что невозможно в других режимах, и взаимодействовать с ней без триггер-слова «Алиса»

🔵 Распознавание речи — переводит речь в текст для восприятия Alice AI LLM;

🔵 Большая языковая модель — генерирует ответ на текстовый запрос, но так, что ответы лучше воспринимаются на слух и отличаются от обычных текстовых;

🔵 Синтез речи — произносит ответ нейросети голосом.

Работа каскада моделей позволяет убрать паузы, убивающие ощущение живого разговора.

Опробовать новый голосовой режим можно прямо сейчас — в приложении Алиса AI нужно нажать на иконку в левом верхнем углу, а затем выбрать режим «Поговорить».

Подписывайтесь 👉 @techno_yandex