Adobe Voco - это еще не выпущенное программное обеспечение для редактирования и создания прототипов аудио от Adobe, которое позволяет редактировать и генерировать аудио по-новому. Названный « Photoshop- for-voice» [1], он был впервые показан на мероприятии Adobe MAX в ноябре 2016 года. Технология, показанная на Adobe MAX, представляла собой предварительный просмотр, который потенциально может быть включен в Adobe Creative Cloud . Позже выяснилось, что Voco никогда не предназначался для выпуска и должен был стать исследовательским прототипом [2] [3].
Технические подробности
Как показала демонстрация, программное обеспечение занимает примерно 20 минут речи желаемой цели и генерирует похожий на звук голос, включая фонемы , которые не присутствовали в материале целевого примера. Adobe заявила, что Voco снизит стоимость аудиопроизводства. [1] С появлением Adobe Voco и аналогичной технологии WaveNet , созданной DeepMind . [3]
Обеспокоенность
Проблемы этики и безопасности были подняты в связи с возможностью изменить аудиозапись, чтобы включить в нее слова и фразы, которые исходный говорящий никогда не произносил, а также потенциальным риском для биометрии голосовых отпечатков . [1]
Также возникли опасения, что его можно использовать вместе с:
- Синтез человеческого изображения , который с начала 2000-х достиг такого уровня сходства, что очень сложно отличить человека, записанного с помощью камеры, от имитации человека. [4]
- Видео-манипуляции с выражениями лица человека в режиме, близком к реальному времени, с использованием существующего 2D-видео с изображением RGB. [5]
Альтернативы
Отсутствие публичной информации о прогрессе Adobe открыло возможности для других компаний создавать продукты, альтернативные VOCO, такие как Resemble AI. [6]
WaveNet - похожий исследовательский проект с открытым исходным кодом лондонской фирмы DeepMind , занимающийся искусственным интеллектом , который независимо разрабатывался примерно в то же время, что и Adobe Voco.
Рекомендации
- ^ a b c "сапик" . BBC.com . BBC . 2016-11-07 . Проверено 5 июля 2016 .
- ^ https://community.adobe.com/t5/audition/beta-testing-voco/td-p/8635263?page=1
- ^ а б "Adobe VoCo мертв?" . Adobe Blog . 2018-01-27 . Проверено 17 июня 2020 .
- ^ Роджерс, Джулиан. «Adobe Voco - стоит ли бояться?» . Эксперт по производству . Профессиональные инструменты . Проверено 14 декабря 2018 .
- ^ Тиз, Юстус (2016). «Face2Face: захват лица в реальном времени и воспроизведение видео в формате RGB» . Proc. Компьютерное зрение и распознавание образов (CVPR), IEEE . Проверено 18 июня 2016 .
- ^ «Похоже на AI - голоса, генерируемые AI» . напоминают.ai . Архивировано из оригинала на 2018-04-24 . Проверено 27 марта 2018 .