Исследователи из лаборатории MIT CSAIL разработали ИИ-систему, способную имитировать звуки человеческим голосом без предварительного обучения. Система может воспроизводить различные звуки — от шелеста листьев до сирены скорой помощи, никогда ранее не слышав человеческих имитаций.
Для создания системы ученые разработали модель человеческого голосового тракта, имитирующую работу голосовых связок, горла, языка и губ. В ходе экспериментов участники предпочли ИИ-имитации человеческим в 25% случаев, а для некоторых звуков (например, звук моторной лодки) этот показатель достигал впечатляющих 75%.
Несмотря на успехи, система все еще имеет ограничения — она плохо справляется с некоторыми согласными звуками, например z, что приводит к неточностям при имитации жужжания пчел. Кроме того, пока не удается воспроизвести человеческую речь, музыку и звуки, которые по-разному имитируются в разных языках.
Источник новости и обложки: news.mit.edu