Монреальский стартап Lyrebird, основанный на искусственном интеллекте и нейросетях, может не только достоверно сэмулировать чужую речь, но и придать ей определенную эмоциональную окраску. Для этого ему потребуется всего лишь минутная запись с голосом человека, который необходимо имитировать.
Для демонстрации мощности системы разработчики использовали образцы голосов Дональда Трампа, Барака Обамы и Хиллари Клинтон, и сгенерировали несколько предложений.
Разработчики осознают, что их технологию можно использовать в не самых честных целях — например, для подделки каких-либо доказательств, проникновения в помещения и здания с голосовым замком, или даже для управления чьей-то Siri. Поэтому на их сайте опубликован некий кодекс, который просит и требует, чтобы данная технология, превратившись в общедоступную и популярную, не стала инструментом мошенничества.
По словам Александра де Бребиссон (Alexandrt de Brebisson), одного из студентов, занимающихся разработкой Lyrebird, информацию о технологии как раз и опубликовали для того, чтобы люди перестали слепо верить аудиодоказательствам. «Примерно то же самое, что сделал и Photoshop», — объясняет он.
Также Александр добавил, что бета-версия API для сторонних разработчиков выйдет «скоро», но конкретной даты не назвал.