Все новости
Это интересно
Сейчас читают
Технологии
Аватар Evernews Evernews

Microsoft создала ИИ, имитирующий голос по 3-секундной записи

6
0
Поделиться
Телеграфировать

Самостоятельно поэкспериментировать с моделью не получится.

Microsoft создала ИИ, имитирующий голос по 3-секундной записи

Группа исследователей корпорации Microsoft рассказала о создании нейросети VALL-E, способной имитировать голоса людей. У VALL-E есть особенность: для обучения ИИ нужна очень короткая запись речи реального человека.

По оценке исследователей, VALL-E может правдоподобно имитировать речь, обучившись на 3-секундной записи настоящего голоса. Исследователи выложили несколько десятков примеров; в основном они и в самом деле звучат очень хорошо, но некоторые примеры заметно отличаются от эталонной записи.

На самом деле, объясняют в Microsoft, короткая запись используется только для донастройки модели. Основное обучение VALL-E проводилось на датасете LibriLight, включающем в себя 60 тысяч часов речи на английском языке.

После дообучения VALL-E может озвучивать любой предложенный текст. Примечательно, что ИИ способен имитировать не только голос, но и сопутствующие эффекты: например, сделать так, чтобы казалось, будто человек говорит по телефону.

Исследователи осознают, что технология может использоваться для выдачи себя за другого человека, поэтому код и демо-версию VALL-E не стали публиковать.

Читать далее
За сколько вы готовы купить GTA VI?
До 8000 рублей
2071 голос, 7.2%
До 7000 рублей
790 голосов, 2.8%
До 6000 рублей
948 голосов, 3.3%
До 5000 рублей
2530 голосов, 8.9%
До 4000 рублей
1008 голосов, 3.5%
До 3000 рублей
1354 голоса, 4.7%
До 2000 рублей
3210 голосов, 11.2%
За любые деньги
1596 голосов, 5.6%
Ни за сколько, я пират
15077 голосов, 52.7%
Теги: Технологии
Аватар Evernews
Evernews
8089 подписчиков