ЁЙ сегодня

ИИ с человеческим голосом

Разработчики крупнейшего китайского поисковика научили искусственный интеллект говорить человеческим голосом


Разработчики Baidu Research разработали алгоритм Deep Voice, который преобразовывает текст в человеческую речь. Напомним что Baidu Research является частью крупнейшего китайского поисковика Baidu. Новая разработка способна озвучивать текст «на лету». До этого проекта существовали алгоритмы для преобразования текста в голос, но для их работы требовалось значительно время от нескольких минут до нескольких часов.

Результат работы Deep Voice практически не отличим от речи живого человека. Алгоритм имитирует интонацию, акцент и настроение.  Голос может быть мужским или женским. Создатели алгоритма уверены, что он вполне может справиться с синхронным озвучиванием фильмов или дубляжом по субтитрам. Разработчики игр получат новый инструмент для локализации выпусков без привлечения профессиональных актеров.

По словам Лео Зу — одного из авторов проекта — «наше творение является настоящим прорывом с технической точки зрения,
ведь мы реализовали синтез речи со всеми ее особенностями.»

Deep Voice работает на основе нейронных сетей на достаточно простых функциях. Алгоритм можно адаптировать под различные условия, он не требователен к ресурсам и легко приспосабливается к новым условиям.