Компания Тимура Бекмамбетова займется развитием алгоритма, имитирующего голоса знаменитостей 29 октября 2019 г. время публикации: 17:51

Компания кинопродюсера Тимура Бекмамбетова Screenlife Technologies и разработчик HR-сервиса на основе искусственного интеллекта «Робот Вера» «Стафори» объявили о создании совместного предприятия для развития проекта Vera Voice, который позволит имитировать голоса знаменитостей на русском языке.

Как пишет РБК со ссылкой на совместный релиз партнеров, в основе Vera Voice лежат нейросети, которые обучаются копировать речь на примере оригинала. Как сообщил VC.ru сооснователь «Стафори» Владимир Свешников алгоритм синтезирует голос с учетом индивидуальных особенностей произношения слов, скорости речи, интонаций и тембра. Примеры синтезированных голосов, опубликованные на YouTube, звучат весьма реалистично, хотя отдельные слова звучат не вполне натурально.

«Для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса и оцифрованный текст, который он зачитывает. Аудиопоток и текст «выгружаются» в несколько нейронных сетей одновременно, одна – генерирует спектрограмму звука (его визуальное изображение), а вторая – непосредственно звук», – рассказал Свешников.

Применять Vera Voice партнеры планируют для поздравлений и розыгрышей, а также озвучки рекламных роликов, фильмов, игр и аудиокниг. При этом с людьми, голоса которых будет имитировать алгоритм, планируется заключать договоры. В частности, договор на легальное использование голоса уже подписан с сооснователем студии «Кубик в кубе» Русланом Габидуллиным.

По словам Бекмамбетова, партнеры намерены реагировать на случаи нелегального использования Vera Voice. «Отлавливать подделки и защищать известных людей от несанкционированного копирования их образов – одна из главных задач нашего проекта», – заявил он.

Vera Voice – не первый проект в своем роде. Так, в похожую разработку ранее вложил деньги «Сбербанк». Созданная банком компания АБК в январе этого года представила ролик с синтезированным голосом актера Иннокентия Смоктуновского. В 2016 году открытый алгоритм для синтеза человеческой речи с помощью нейросети под названием WaveNet представила принадлежащая Google компания DeepMind. Кроме того, известные голоса может имитировать и голосовой помощник Alexa компании Amazon.

Напомним, в начале сентября стало известно, что в марте этого года мошенники при помощи искусственного интеллекта подделали чужой голос и смогли заработать на этом 243 тыс. долларов. Злоумышленники ввели в заблуждение генерального директора неназванной британской энергетической компании – они позвонили ему от имени исполнительного директора немецкой головной компании. Искусно подделанный голос со знакомыми тембром и немецким акцентом попросил срочно перевести венгерскому поставщику 243 тыс. долларов, и ставший жертвой обмана директор компании выполнил его просьбу.

Источник: newsru.com

Понравилась статья? Поделиться с друзьями:
android
Добавить комментарий