Створено мовної синтезатор на основі ІІ, здатний відтворити будь-який голос

Практично всі існуючі на даний момент віртуальні помічники, якими б просунутими функціями вони не володіли, мають вкрай дивний «машинний» голос, який ні з чим не сплутаєш. Відбувається це від того, що голосові синтезатори використовують для мовлення набір заздалегідь записаних фраз, звуків і їх комбінацій. Як вважають деякі експерти в цій галузі, поліпшення якості звучання можна досягти за допомогою використання штучного інтелекту, що і продемонструвала компанії Lyrebird з Монреаля. Їх розробка може відтворити голос будь-якої людини.

Їх розробка може відтворити голос будь-якої людини

Для наслідування голосу системі досить лише кількох секунд аудіозапису голосу необхідного людини, на основі яких і буде створений звуковий фрагмент. Точне наслідування голосу можливо завдяки використанню нейронних мереж на основі штучного інтелекту, які працюють за тими ж принципами, що нейронні мережі людського мозку. ІІ вчиться розпізнавати особливості мови людини, а потім ці дані вже використовуються для синтезу штучного голосу. Зараз робота нової системи все ще не позбавлена недоліків: є проблеми з розбірливість усного мовлення, присутні «голосові артефакти» і деякі інші ознаки, що вказують на те, що слова вимовляє машина. Однак всі вони можуть бути легко усунені в майбутньому, адже вже зараз система працює в режимі реального часу. Як стверджує один з авторів проекту Хосе Сотело,

«Наша програма навчалася на великій кількості аудіофрагментів виступів тисяч різних людей. Отримана інформація стискається до вигляду свого роду «голосовий ДНК», яка є цифровим ключем. Потім на основі цього ключа система може відтворювати будь-які слова, навіть ті, які не були задіяні в процесі навчання ».

Самі автори проекту прекрасно розуміють, що при належному рівні розвитку цієї технології не уникнути проблем з безпекою. Наприклад, для обходу систем ідентифікації користувача по голосу. Представники компанії Lyrebird порівнюють свій винахід з винаходом фотошопа. Після створення пакету програм від Adobe стало складно довіряти зображень на екрані. Тепер же довіряти не можна і голосу.

«Ми розуміємо, що через високого рівня розвитку сучасних технологій такий голосовий синтезатор з'явився б на світ рано чи пізно. Ми закликаємо всіх розпочати відмовлятися від прийняття в якості доказів різних аудіозаписів, а також використання засобів захисту на основі голосу ».

У будь-якому випадку поки що турбуватися рано, адже система дуже сира, а в «синтетичних» голосах все ще звучать «роботизовані нотки». Ознайомитися з тим, як система Lyrebird відтворює голоси Барака Обами, Дональда Трампа і ряду інших політичних діячів, ви можете по цим посиланням .

Донецький Обласний Краєзнавчий Музей

Створено мовної синтезатор на основі ІІ, здатний відтворити будь-який голос

Підпишись