Нейронная сеть WaveNetEQ договорит то, что не услышал собеседник

Нейронная сеть WaveNetEQ договорит то, что не услышал собеседник

При проведении видеоконференций качество связи имеет решающее значение. Но если она плохая, то поможет алгоритм, разработанный Google.

Уже более месяца из-за пандемии офисные работники вынуждены работать удаленно. Когда нужно что-то обсудить, они делают это через интернет. Но иногда качество связи может подвести и тогда появляются раздражающие помехи.

Один из нейросетевых алгоритмов искусственного интеллекта, имитирующий говорящего, может договорить то, что было не распознано или не услышано собеседником. Алгоритм был разработан инженерами Google и уже используется в приложении для видеозвонков Google Duo (пока только в телефонах Pixel 4).

Команда создала нейронную сеть WaveNetEQ, которая умеет заполнять прерывания в аудиозвонке реалистично синтезированным голосом собеседника, а также говорить на 50 языках. Обучение алгоритма продолжалось до тех пор, пока он не научился точно воспроизводить характеристики голоса говорящего (интонация, тембр) и, конечно же, в точности использовать его обороты речи.

Пока искусственный интеллект правильно произносит только отдельные слоги, т.е. он способен восстановить лишь недостающие фрагменты слов. Страшно подумать, что произойдет, когда он научится оперировать целыми текстами с сохранением стиля оригинала.

Google сумела адаптировать новый алгоритм на смартфонах, который может работать в режиме реального времени и теперь планирует распространять его на других устройствах.

Исхаков Максим

Руководитель информационного портала "Безопасник". Директор компании по продаже и установке систем безопасности.

Оцените автора
Портал о системах видеонаблюдения и безопасности
Добавить комментарий