Ученые MIT научили ИИ имитировать звуки как человек

06.02.2025

Исследователи из лаборатории MIT CSAIL разработали ИИ-систему, способную имитировать звуки человеческим голосом без предварительного обучения. Система может воспроизводить различные звуки — от шелеста листьев до сирены скорой помощи, никогда ранее не слышав человеческих имитаций.

Для создания системы ученые разработали модель человеческого голосового тракта, имитирующую работу голосовых связок, горла, языка и губ. В ходе экспериментов участники предпочли ИИ-имитации человеческим в 25% случаев, а для некоторых звуков (например, звук моторной лодки) этот показатель достигал впечатляющих 75%.

Несмотря на успехи, система все еще имеет ограничения — она плохо справляется с некоторыми согласными звуками, например z, что приводит к неточностям при имитации жужжания пчел. Кроме того, пока не удается воспроизвести человеческую речь, музыку и звуки, которые по-разному имитируются в разных языках.

Источник новости и обложки: news.mit.edu

Мирослав Кунгуров

Работаю главным редактором proglib.io — опубликовал более 800 статей и создал популярные рассылки о нейросетях и разработке. Помимо редактуры владею Python, с его помощью автоматизирую повседневные задачи.

Политика конфиденциальности / ВК