Синтетические медиа


Синтетические медиа (также известные как медиа , генерируемые ИИ , [1] [2] генеративные медиа , [3] персонализированные медиа , [4] и в просторечии как дипфейки [5] ) - это универсальный термин для искусственного производства, манипулирования, и модификация данных и носителей с помощью автоматизированных средств, особенно с использованием алгоритмов искусственного интеллекта , например, с целью введения людей в заблуждение или изменения первоначального значения. [6] [7] [8] [9] Сфера синтетических медиа быстро выросла с момента создания генеративных враждебных сетей.в первую очередь за счет появления дипфейков, а также синтеза музыки, генерации текста, синтеза человеческих образов, синтеза речи и многого другого. [9] Хотя эксперты используют термин «синтетический носитель», отдельные методы, такие как дипфейки и синтез текста, иногда не упоминаются как таковые в СМИ, а вместо этого используются соответствующей терминологией (и часто используют «дипфейки» в качестве эвфемизма, например: « дипфейки для текста «для генерации естественного языка;« дипфейки для голосов »для нейронного клонирования голоса и т. д.) [10] [11] Значительное внимание привлекло к области синтетических медиа, начиная с 2017 года, когда Vice сообщил о появлении порнографических видео изменены с использованием алгоритмов ИИ для вставки лиц известных актрис. [12] Опасения перед синтетическими СМИ включают в себя возможность раздуть фальшивые новости, распространение дезинформации, недоверие к реальности, [12] массовую автоматизацию творческой и журналистской работы и, возможно, полное отступление в созданные искусственным интеллектом фантастические миры. [13] Синтетические медиа - это прикладная форма искусственного воображения . [12]

До 1950-х годов

Синтетические средства массовой информации как процесс автоматизированных дат искусства назад к автоматам из древнегреческой цивилизации , где изобретатели , такие как Дедал и Герой Александрии разработаны машины , способных писать текст, создавая звуки, и играет музыку. [14] [15] Традиция автоматных развлечений процветала на протяжении всей истории, с кажущейся магической способностью механических существ имитировать человеческое творчество, часто собирая толпы по всей Европе, [16] Китае, [17] Индии, [18] и так далее. . Другие автоматизированные новинки, такие как « Musikalisches Würfelspiel » (Музыкальная игра в кости) 1757 года Иоганна Филиппа Кирнбергера, также развлекали публику. [19]

Однако, несмотря на технические возможности этих машин, ни одна из них не могла генерировать исходный контент и полностью зависела от их механической конструкции.

Рост искусственного интеллекта

Область исследований искусственного интеллекта зародилась на семинаре в Дартмутском колледже в 1956 году [20], положив начало развитию цифровых вычислений, используемых в качестве средства искусства, а также развитию генеративного искусства . Первоначальные эксперименты в искусстве, созданном с помощью искусственного интеллекта, включали Illiac Suite , композицию 1957 года для струнного квартета, которая, как правило, считается первой партитурой, написанной на электронном компьютере . [21] Лежарен Хиллер в сотрудничестве с Леонардом Иссаксоном запрограммировал компьютер ILLIAC I в Иллинойском университете в Урбана-Шампейн (где оба композитора были профессорами) для создания композиционного материала для своего струнного квартета № 4.

В 1960 году российский исследователь Р.Х. Зарипов опубликовал первую в мире работу по алгоритмическому сочинению музыки на ЭВМ « Урал-1 ». [22]

В 1965 году изобретатель Рэй Курцвейл представил пьесу для фортепиано, созданную компьютером, которая была способна распознавать образы в различных композициях. Затем компьютер смог проанализировать и использовать эти шаблоны для создания новых мелодий. Компьютер дебютировал в программе Стива Аллена «Я получил секрет» и ставил ведущих в тупик, пока кинозвезда Генри Морган не разгадал секрет Рэя. [23]

До 1989 года искусственные нейронные сети использовались для моделирования определенных аспектов творчества. Питер Тодд (1989) впервые обучил нейронную сеть воспроизводить музыкальные мелодии из обучающего набора музыкальных произведений. Затем он использовал алгоритм изменения, чтобы изменить входные параметры сети. Сеть могла произвольно генерировать новую музыку крайне неконтролируемым образом. [24] [25]

В 2014 году Ян Гудфеллоу и его коллеги разработали новый класс систем машинного обучения : генеративные состязательные сети ( GAN ). [26] Две нейронные сети соревнуются друг с другом в игре (в смысле теории игр , часто, но не всегда в форме игры с нулевой суммой ). Учитывая обучающий набор, этот метод учится генерировать новые данные с той же статистикой, что и обучающий набор. Например, GAN, обученный фотографиям, может создавать новые фотографии, которые выглядят, по крайней мере, внешне аутентичными для человека-наблюдателя, имея множество реалистичных характеристик. Хотя первоначально предложено в качестве одной из форм порождающей модели для неконтролируемого обучения , Gans также оказался полезным для полуобучаемого обучения , [27] полностью контролируемого обучения , [28] и усиление обучения . [29] На семинаре 2016 года Янн ЛеКун назвал GAN «самой крутой идеей в области машинного обучения за последние двадцать лет». [30]

В 2017 году, Google представил трансформаторы , [31] новый тип нейронной архитектуры сети , специализирующуюся на моделирование языка , что позволило для быстрого достижения в области обработки естественного языка . Трансформаторы оказались способными к высоким уровням обобщения, что позволило сетям, таким как GPT-3 и Jukebox от OpenAI, синтезировать текст и музыку соответственно на уровне, приближающемся к человеческим способностям. [32] [33]

Дипфейки

Deepfakes (а портманто из « глубокого обучения » и «подделки» [34] ) является наиболее заметной формой синтетических сред. [35] [36] Это средства массовой информации, которые берут человека в существующем изображении или видео и заменяют его чьим-то подобием с помощью искусственных нейронных сетей . [37] Они часто комбинируют и накладывают существующие медиа на исходные с помощью методов машинного обучения , известных как автокодеры и генеративные состязательные сети (GAN). [38] [39] Deepfakes снискали всеобщее внимание на их использование в знаменитости порнофильмах , порноместь , новости поддельной , мистификаций и финансового мошенничества . [40] [41] [42] [43] Это вызвало реакцию как промышленности, так и правительства с целью выявления и ограничения их использования. [44] [45]

Термин «дипфейки» возник примерно в конце 2017 года от пользователя Reddit по имени «дипфейки». [37] Он, как и другие участники сообщества r / deepfakes Reddit, поделился созданными ими дипфейками; во многих видеороликах лица знаменитостей были заменены на тела актрис в порнографических видеороликах [37], в то время как непорнографический контент включал множество видеороликов с лицом актера Николаса Кейджа , замененными в различных фильмах. [46] В декабре 2017 года Саманта Коул опубликовала статью о дипфейках в Vice, которая впервые привлекла внимание общественности к дипфейкам, распространяемым в онлайн-сообществах. [47] Шесть недель спустя Коул написал в последующей статье о большом росте фальшивой порнографии с использованием искусственного интеллекта. [37] В феврале 2018 года R / deepfakes был запрещен Reddit за распространение недобровольной порнографии. [48] Другие веб-сайты также запретили использование дипфейков для недобровольной порнографии, включая платформу социальных сетей Twitter и сайт порнографии Pornhub . [49] Однако некоторые веб-сайты еще не запретили контент Deepfake, в том числе 4chan и 8chan. [50]

Непорнографический дипфейк-контент продолжает набирать популярность: видео от создателей YouTube, таких как Ctrl Shift Face и Shamook, [51] [52] [53] [54], набирают миллионы просмотров. Сообщество Reddit / SFWdeepfakes было создано специально для обмена видео, созданными для развлечения, пародий и сатиры. [55] Мобильное приложение Impressions было запущено для iOS в марте 2020 года. Приложение предоставляет пользователям платформу для дип-фейка лиц знаменитостей в видео за считанные минуты. [56]

Синтез изображения

Синтез изображений - это искусственное создание визуальных медиа, особенно с помощью алгоритмических средств. В развивающемся мире синтетических медиа работа по созданию цифровых изображений - когда-то была сферой деятельности высококвалифицированных программистов и голливудских художников по спецэффектам - может быть автоматизирована с помощью экспертных систем, способных создавать реализм в огромных масштабах. [57] Один подпола это включает в себя синтез человеческого образа , который является использованием нейронных сетей , чтобы сделать правдоподобные и даже фотореалистичные выдачи [58] [59] человеческими-подобий, подвижных или неподвижным. Фактически он существует с начала 2000- х годов . Во многих фильмах, использующих компьютерные изображения, были представлены синтетические изображения человекоподобных персонажей, наложенные в цифровой форме на реальный или другой смоделированный киноматериал. К концу 2010-х годов искусственный интеллект с глубоким обучением был применен для синтеза изображений и видео, похожих на людей, без помощи человека, после завершения фазы обучения, тогда как старый школьный 7D-маршрут требовал огромного количества человеческой работы. . Веб-сайт This Person Does Not Exist демонстрирует полностью автоматизированный синтез человеческих изображений путем бесконечной генерации изображений, похожих на портреты человеческих лиц. [60] Веб-сайт был опубликован в феврале 2019 года Филипом Вангом.

Аудио синтез

Помимо дипфейков и синтеза изображений, аудио - еще одна область, в которой ИИ используется для создания синтетических медиа. [61] Синтезированный звук будет способен генерировать любой мыслимый звук, который может быть достигнут посредством манипуляции звуковой формой волны, которая, вероятно, может быть использована для генерации стандартного звука звуковых эффектов или имитации звука в настоящее время воображаемых вещей. [62]

Музыкальное поколение

Возможность генерировать музыку с помощью автономных, непрограммируемых средств давно востребована со времен античности, и с развитием искусственного интеллекта возникли две конкретные области:

  1. Роботизированное создание музыки с помощью машин, играющих на инструментах, или сортировки нот виртуальных инструментов (например, через файлы MIDI ) [63] [64]
  2. Прямая генерация сигналов, которые идеально воссоздают инструментальные средства и человеческий голос без необходимости использования инструментов, MIDI или организации готовых нот. [65]

В 2016 году Google DeepMind представил WaveNet, глубокую генеративную модель необработанных звуковых сигналов, которая может научиться понимать, какие формы сигналов больше всего напоминают человеческую речь, а также музыкальные инструменты. [66] Другие сети, способные генерировать музыку посредством манипулирования формой волны, включают TacoTron (от Google) и DeepVoice (от Baidu).

Синтез речи

Синтез речи был определен как популярная ветвь синтетических медиа [67] и определяется как искусственное создание человеческой речи . Компьютерная система, используемая для этой цели, называется речевым компьютером или синтезатором речи и может быть реализована в программных или аппаратных продуктах. А текст-в-речь ( TTS ) Система преобразует нормальный текст языка в речи; другие системы переводят в речь символические лингвистические представления, такие как фонетическая транскрипция . [68]

Синтезированная речь может быть создана путем объединения частей записанной речи, которые хранятся в базе данных . Системы различаются размером хранимых речевых единиц; система, в которой хранятся телефоны или дифоны, обеспечивает самый большой выходной диапазон, но может не иметь четкости. Для определенных областей использования хранение целых слов или предложений обеспечивает высококачественный вывод. В качестве альтернативы синтезатор может включать модель речевого тракта и другие характеристики человеческого голоса для создания полностью «синтетического» речевого вывода. [69]

Виртуальные помощники, такие как Siri и Alexa, могут преобразовывать текст в звук и синтезировать речь. [70] WaveNet, DeepMind - это глубокая генеративная модель необработанных звуковых сигналов, специализирующаяся на человеческой речи. [66] TacoTron и LyreBird - другие сети, способные генерировать правдоподобную человеческую речь. [71]

Генерация на естественном языке

Генерация естественного языка ( NLG , иногда синоним синтеза текста ) - это программный процесс, преобразующий структурированные данные в естественный язык. Его можно использовать для создания подробного содержимого для организаций, чтобы автоматизировать настраиваемые отчеты, а также для создания настраиваемого содержимого для веб-приложений или мобильных приложений. Его также можно использовать для создания коротких текстов в интерактивных беседах ( чат-бот ), которые даже могут быть прочитаны системой преобразования текста в речь . Интерес к генерации естественного языка увеличился в 2019 году после того, как OpenAI представила GPT2, систему искусственного интеллекта, которая генерирует текст, соответствующий его вводу по теме и тону. [72] GPT2 - это преобразователь , модель глубокого машинного обучения, представленная в 2017 году и используемая в основном в области обработки естественного языка (NLP). [73]

Синтез интерактивных медиа

Созданные искусственным интеллектом носители могут быть использованы для разработки гибридной графической системы, которая может использоваться в видеоиграх, фильмах и виртуальной реальности [74], а также в текстовых играх, таких как AI Dungeon 2, в которых используется либо GPT-2, либо GPT-3 открывает почти бесконечные возможности, которые иначе невозможно создать с помощью традиционных методов разработки игр. [75] [76] Компания Nvidia, производящая компьютерное оборудование , также работала над созданными с помощью искусственного интеллекта демонстрациями видеоигр, такими как модель, которая может создавать интерактивную игру на основе неинтерактивных видео. [77] Посредством процедурной генерации методы синтетических медиа могут в конечном итоге использоваться, чтобы «помочь дизайнерам и разработчикам создавать художественные ресурсы, уровни дизайна и даже создавать игры с нуля». [77]

Дипфейки использовались для искажения известных политиков в видеороликах. В отдельных видеороликах лицо президента Аргентины Маурисио Макри заменено лицом Адольфа Гитлера , а лицо Ангелы Меркель заменено лицом Дональда Трампа . [78] [79]

В июне 2019 года было выпущено загружаемое приложение для Windows и Linux под названием DeepNude, которое использовало нейронные сети, в частности генеративные состязательные сети , для удаления одежды с изображений женщин. У приложения была как платная, так и неоплачиваемая версия, платная версия стоила 50 долларов. [80] [81] 27 июня создатели удалили приложение и вернули потребителям деньги. [82]

Конгресс США провел заседание сената, на котором обсуждались широко распространенные воздействия синтетических медиа, включая дипфейки, описывая их как «потенциал, который можно использовать для подрыва национальной безопасности, подрыва общественного доверия к нашей демократии и других гнусных причин». [83]

В 2019 году технология клонирования голоса была использована, чтобы успешно имитировать голос исполнительного директора и потребовать мошеннического перевода на сумму 220 000 евро. [84] Дело вызвало обеспокоенность по поводу отсутствия методов шифрования в телефонных разговорах, а также безоговорочного доверия, которое часто оказывают голосовой связи и средствам массовой информации в целом. [85]

Начиная с ноября 2019 года, несколько социальных сетей начали запрещать синтетические медиа, используемые для манипуляций в преддверии президентских выборов в США 2020 года. [86]

Методы синтетических медиа включают создание, обработку и изменение данных для имитации творческих процессов в гораздо более быстром и точном масштабе. [87] В результате потенциальные возможности использования столь же широки, как и само человеческое творчество, от революционных изменений в индустрии развлечений до ускорения научных исследований и разработок. Первоначально его применяли для синхронизации движений губ, чтобы повысить вовлеченность обычного дубляжа [88], который быстро растет с появлением ОТТ . [89] В более широком смысле синтетические медиа будут демократизировать стоимость производства медиа и уменьшат потребность в дорогих камерах, записывающем оборудовании и визуальных эффектах. [90] Крупные новостные организации уже изучают, как они могут использовать видеосинтез и другие синтетические медиа-технологии, чтобы стать более эффективными и привлекательными. [91] [92] Потенциальные опасности в будущем включают использование комбинации различных подполей для генерации фейковых новостей , [93] рои ботов на естественном языке, генерирующие тенденции и мемы , создание ложных доказательств и потенциально склонность к персонализированному контенту и отступление. в созданные искусственным интеллектом фантастические миры в виртуальной реальности. [13]

В 2019 году Илон Маск предупредил о потенциальном использовании передовых ботов, генерирующих текст, для манипулирования людьми в социальных сетях. [94] В будущем еще более продвинутые боты могут быть использованы для астротурфинга или демонизации приложений, веб-сайтов и политических движений, а также для усиления мемов и культурных тенденций, в том числе созданных с единственной целью - продвижение ботами до тех пор, пока люди увековечивают их без дальнейшей помощи.

Генераторы естественного языка на основе глубокого обучения с подкреплением потенциально могут стать первыми системами искусственного интеллекта, которые пройдут тест Тьюринга и потенциально могут быть использованы в качестве продвинутых чат-ботов [95], которые затем могут быть использованы для создания искусственных отношений, как в 2013 году. снимать ее и спамить правдоподобными комментариями к новостным статьям.

Одним из вариантов использования генерации естественного языка является создание или помощь в написании романов и рассказов [96], в то время как другие потенциальные разработки - это стилистические редакторы, подражающие профессиональным писателям. [97] Та же самая техника может затем использоваться для написания песен, стихов и технического написания, а также для переписывания старых книг в стилях других авторов и создания выводов для неполных серий. [98]

Инструменты синтеза изображений могут упростить или даже полностью автоматизировать создание определенных аспектов визуальных иллюстраций, таких как мультфильмы , комиксы и политические мультфильмы . [99] [100] Поскольку процесс автоматизации устраняет необходимость в командах дизайнеров, художников и других лиц, участвующих в создании развлечений, затраты могут снизиться практически до нуля и позволить создавать «мультимедийные франшизы для спальни», где отдельные люди могут генерировать результаты, неотличимые от самых бюджетных произведений, за немного больше, чем стоимость работы их компьютера. [101] Инструменты создания персонажей и сцен больше не будут основываться на готовых материалах, тематических ограничениях или личных навыках, а будут основываться на настройке определенных параметров и предоставлении достаточного количества входных данных. [102]

Комбинация синтеза речи и дипфейков использовалась для автоматического преобразования речи актера на несколько языков без необходимости повторных съемок или языковых занятий. [101]

Также опасаются увеличения числа кибератак из-за автоматизации методов фишинга , кошачьего фишинга и социального взлома с помощью новых технологических методов. [85]

Боты для генерации естественного языка, смешанные с сетями синтеза изображений, теоретически могут использоваться для засорения результатов поиска, наполняя поисковые системы триллионами бесполезных, но выглядящих законно блогами, веб-сайтами и маркетинговым спамом. [103]

Были предположения о том, что дипфейки будут использоваться для создания цифровых актеров для будущих фильмов. Созданные / измененные цифровыми методами люди уже использовались в фильмах и раньше, и дипфейки могут внести свой вклад в новые разработки в ближайшем будущем. [104] Любительская технология дипфейка уже использовалась для вставки лиц в существующие фильмы, например, вставка молодого лица Харрисона Форда на лицо Хана Соло в « Соло: Звёздные войны. История» , [105] и методы, подобные тем, что используются в фильмах. Дипфейки использовались для игры принцессы Леи в Rogue One . [106]

GAN можно использовать для создания фотографий воображаемых фотомоделей без необходимости нанимать модель, фотографа, визажиста или платить за студию и транспорт. [107] Сети GAN могут использоваться для создания рекламных кампаний в моде, включающих более разнообразные группы моделей, что может усилить намерение совершить покупку среди людей, похожих на моделей [108] или членов семьи. [109] GAN также можно использовать для создания портретов, пейзажей и обложек альбомов . Способность GAN создавать фотореалистичные человеческие тела представляет собой проблему для таких отраслей, как модельное моделирование , которые могут подвергаться повышенному риску автоматизации. [110] [111]

В 2019 году Dadabots представили поток дэт-метала, созданный искусственным интеллектом, который продолжается без пауз. [112]

Музыкальные исполнители и их соответствующие бренды также могут быть созданы с нуля, включая музыку, видео, интервью и рекламные материалы, созданные искусственным интеллектом. И наоборот, существующая музыка может быть полностью изменена по желанию, например, смена текста, певцов, инструментовки и композиции. [113] В 2018 году, используя процесс WaveNet для передачи тембров музыки, исследователи смогли перенести целые жанры из одного в другой. [114] С помощью искусственного интеллекта старые группы и артисты могут быть «возрождены» для выпуска нового материала без пауз, который может даже включать «живые» концерты и рекламные изображения.

Нейронные сети с питанием от манипуляции фото имеет потенциал , чтобы подстрекать на поведение тоталитарных и абсолютистских режимов. [115] Достаточно параноидальное тоталитарное правительство или сообщество может участвовать в полном стирании истории, используя всевозможные синтетические технологии, выдумывая историю и личности, а также любые доказательства их существования во все времена. Даже в других рациональных и демократических обществах определенные социальные и политические группы могут использовать синтетические материалы для создания культурных, политических и научных коконов, которые значительно снижают или даже полностью разрушают способность общества соглашаться по основным объективным фактам. И наоборот, существование синтетических СМИ будет использоваться для дискредитации фактических источников новостей и научных фактов как «потенциально сфабрикованных». [57]

  • Алгоритмическое искусство
  • Искусственное воображение
  • Automated_journalism
  • Вычислительное творчество
  • Компьютерная музыка
  • ДАЛЛ-Э
  • Дипфейки
  • Генеративное искусство
  • Генеративная состязательная сеть
  • GPT-3
  • Синтез человеческого образа
  • Трансформер (модель машинного обучения)
  • WaveNet

  1. ^ Гудштейн, Анастасия. «Заменит ли искусственный интеллект человеческое творчество?» . Adlibbing.org . Проверено 30 января 2020 года .
  2. ^ Уодделл, Кавех. «Добро пожаловать в наши новые синтетические реальности» . Axios.com . Проверено 30 января 2020 года .
  3. ^ «Почему сейчас самое время быть создателем генерирующих медиа» . Product Hunt . Проверено 15 февраля 2020 .
  4. ^ Игнатиду, София. «Персонализация на основе ИИ в политических и социальных последствиях цифровых медиа» (PDF) . Chatham House . Департамент международной безопасности . Проверено 30 января 2020 года .
  5. ^ Дирик, Искендер. «Почему пора изменить разговор о синтетических медиа» . Венчурный бит . Проверено 4 октября 2020 года .
  6. ^ Валес, Алдана. «Введение в синтетические СМИ и журналистику» . Средний . Wall Street Journal . Проверено 30 января 2020 года .
  7. ^ Харви, Дел. «Помогите нам сформировать наш подход к синтетическим и управляемым медиа» . Блог Twitter . Проверено 30 января 2020 года .
  8. ^ Розенбаум, Стивен. "Что такое синтетические медиа?" . MediaPost . Проверено 30 января 2020 года .
  9. ^ а б «Путеводитель по синтетическим медиа на 2020 год» . Блог Paperspace . 2020-01-17 . Проверено 30 января 2020 года .
  10. ^ Овадья, Авив. «Мифы Deepfake: распространенные заблуждения о синтетических медиа» . Обеспечение демократии . Проверено 30 января 2020 года .
  11. ^ Пэнгберн, диджей. «Вас предупредили: дипфейки всего тела - следующий шаг в мимикрии человека на основе искусственного интеллекта» . Быстрая компания . Проверено 30 января 2020 года .
  12. ^ а б в Валес, Алдана (14 октября 2019 г.). «Введение в синтетические медиа и журналистику» . Средний .
  13. ^ а б Паскарелли, Вальтер. «К синтетической реальности: когда DeepFakes встречает AR / VR» . Oxford Insights . Проверено 30 января 2020 года .
  14. ^ Ноэль Шарки (4 июля 2007 г.), программируемый робот из 60 г. н.э. , 2611 г. , New Scientist
  15. ^ Бретт, Джерард (июль 1954), "автоматам в византийском "Трон Соломона " ", гинекологическое , 29 (3): 477-487, DOI : 10,2307 / 2846790 , ISSN  0038-7134 , JSTOR  2846790 .
  16. ^ Поместье Уоддесдон (22 июля 2015 г.). "Чудесный слон - поместье Ваддесдон" - на YouTube.
  17. ^ Колесников-Джессоп, Соня (25 ноября 2011 г.). «Китайцы, охваченные механической манией» . Нью-Йорк Таймс . Проверено 25 ноября 2011 года . Механические диковинки были в моде в Китае в XVIII и XIX веках, поскольку императоры Цин увлеклись автоматными часами и карманными часами, и «торговцы поющих песен», как называли европейских часовых мастеров, были более чем счастливы поощрять это интерес.
  18. ^ Koetsier, Teun (2001). «О предыстории программируемых машин: музыкальные автоматы, ткацкие станки, калькуляторы». Теория механизмов и машин . Эльзевир. 36 (5): 589–603. DOI : 10.1016 / S0094-114X (01) 00005-2 .
  19. ^ Ниерхаус, Gerhard (2009). Алгоритмическая композиция: парадигмы автоматизированной генерации музыки , стр. 36 и 38n7. ISBN  9783211755396 .
  20. ^ Дартмутская конференция :
    • МакКордак 2004 , стр. 111–136.
    • Crevier 1993 , стр. 47–49., который пишет: «Конференция общепризнана как официальная дата рождения новой науки».
    • Рассел и Норвиг 2003 , стр. 17, которые называют конференцию «рождением искусственного интеллекта».
    • NRC 1999 , стр. 200–201
  21. ^ Денис Л. Багги, " Роль компьютерных технологий в музыке и музыковедении ", lim.dico.unimi.it (9 декабря 1998 г.).
  22. ^ Зарипов, Р.Х. (1960). «Об алгоритмическом описании процесса сочинения музыки (Об алгоритмическом описании процесса сочинения музыки)». Известия АН СССР . 132 (6).
  23. ^ «О Рэе Курцвейле» .
  24. ^ Bharucha, JJ; Тодд, PM (1989). «Моделирование восприятия тональной структуры с помощью нейронных сетей». Компьютерный музыкальный журнал . 13 (4): 44–53. DOI : 10.2307 / 3679552 . JSTOR  3679552 .
  25. Перейти ↑ Todd, PM, and Loy, DG (Eds.) (1991). Музыка и коннекционизм. Кембридж, Массачусетс: MIT Press.
  26. ^ Гудфеллоу, Ян; Пуже-Абади, Жан; Мирза, Мехди; Сюй, Бинг; Вард-Фарли, Дэвид; Озаир, Шерджил; Курвиль, Аарон; Бенжио, Йошуа (2014). Генеративные состязательные сети (PDF) . Труды Международной конференции по системам обработки нейронной информации (NIPS 2014). С. 2672–2680.
  27. ^ Салиманс, Тим; Гудфеллоу, Ян; Заремба, Войцех; Чунг, Вики; Рэдфорд, Алек; Чен, Си (2016). «Улучшенные методы обучения GAN». arXiv : 1606.03498 [ cs.LG ].
  28. ^ Изола, Филипп; Чжу, Цзюнь-Янь; Чжоу, Тинхуэй; Эфрос, Алексей (2017). «Преобразование изображения в изображение с помощью условных состязательных сетей» . Компьютерное зрение и распознавание образов .
  29. ^ Хо, Джонатон; Эрмон, Стефано (2016). «Генеративное состязательное имитационное обучение» . Достижения в системах обработки нейронной информации : 4565–4573. arXiv : 1606.03476 . Bibcode : 2016arXiv160603476H .
  30. ^ ЛеКун, Янн. «Семинар RL: следующий рубеж в искусственном интеллекте: обучение без учителя» .
  31. ^ Uszkoreit, Якоб. «Трансформер: новая архитектура нейронной сети для понимания языков» . Блог Google AI . Проверено 21 июня 2020 .
  32. ^ Браун, Том Б .; Манн, Бенджамин; Райдер, Ник; Суббия, Мелания; Каплан, Джаред; Дхаривал, Прафулла; Нилакантан, Арвинд; Шьям, Пранав; Састры, Гириш; Аскелл, Аманда; Агарвал, Сандхини; Герберт-Восс, Ариэль; Крюгер, Гретхен; Хениган, Том; Ребенок, Ревон; Рамеш, Адитья; Ziegler, Daniel M .; Ву, Джеффри; Зима, Клеменс; Гессен, Кристофер; Чен, Марк; Сиглер, Эрик; Литвин, Матеуш; Грей, Скотт; Шахматы, Бенджамин; Кларк, Джек; Бернер, Кристофер; Маккэндлиш, Сэм; Рэдфорд, Алек; и другие. (2020). «Языковые модели - немногие изучающие». arXiv : 2005.14165 [ cs.CL ].
  33. ^ Дхаривал, Прафулла; Джун, Хиу; Пейн, Кристина; Чон Ук Ким; Рэдфорд, Алек; Суцкевер, Илья (2020). «Музыкальный автомат: Генеративная модель для музыки». arXiv : 2005.00341 [ eess.AS ].
  34. ^ Брэндон, Джон (16.02.2018). «Ужасающее высокотехнологичное порно: все чаще появляются жуткие« дипфейки »» . Fox News . Проверено 20 февраля 2018 .
  35. ^ Грегори, Сэмюэл. «Слышали о дипфейках? Не паникуйте. Готовьтесь» . МЫ Форум . Всемирный экономический форум . Проверено 30 января 2020 года .
  36. ^ Барраби, Томас. «Твиттер разрабатывает политику« синтетических медиа »для борьбы с дипфейками и другими вредоносными публикациями» . Fox Business . Fox News . Проверено 30 января 2020 года .
  37. ^ а б в г Коул, Саманта (24 января 2018 г.). «Нас по-настоящему трахнули: теперь все снимают фальшивое порно, созданное искусственным интеллектом» . Vice . Дата обращения 4 мая 2019 .
  38. ^ Шварц, Оскар (12 ноября 2018 г.). «Вы думали, что фейковые новости - это плохо? Глубокие фейки - это место, где правда умирает» . Хранитель . Проверено 14 ноября 2018 года .
  39. ^ Доктор философии, Свен Чарлир (17 мая 2019 г.). «Семейное развлечение с дипфейками. Или как я пригласил свою жену на вечернее шоу» . Средний . Проверено 8 ноября 2019 .
  40. ^ «Что такое дипфейки и почему будущее порно ужасно» . Высокое благородство . 2018-02-20 . Проверено 20 февраля 2018 .
  41. ^ «Эксперты опасаются, что технология подмены лица может привести к международному противостоянию» . Наброски . Проверено 28 февраля 2018 .
  42. ^ Руз, Кевин (2018-03-04). «Вот и поддельные видео тоже» . Нью-Йорк Таймс . ISSN  0362-4331 . Проверено 24 марта 2018 .
  43. ^ Шрейер, Марко; Саттаров, Тимур; Реймер, Бернд; Борт, Дамиан (2019). «Состязательное изучение дипфейков в бухгалтерском учете». arXiv : 1910.03810 . Bibcode : 2019arXiv191003810S . Цитировать журнал требует |journal=( помощь )
  44. ^ «Присоединяйтесь к конкурсу Deepfake Detection Challenge (DFDC)» . deepfakedetectionchallenge.ai . Проверено 8 ноября 2019 .
  45. ^ Кларк, Иветт Д. (28.06.2019). «HR3230 - 116-й Конгресс (2019-2020): Защита каждого человека от ложных показаний путем сохранения эксплуатации в соответствии с Законом об ответственности от 2019 года» . www.congress.gov . Проверено 16 октября 2019 .
  46. ^ Хейсом, Сэм (31 января 2018 г.). «Люди используют технологию смены лиц, чтобы добавить Николаса Кейджа в случайные фильмы и« Что такое 2018 »» . Mashable . Проверено 4 апреля 2019 года .
  47. ^ Коул, Саманта (11 декабря 2017 г.). «Поддельное порно с искусственным интеллектом уже здесь, и мы все выебаны» . Vice . Проверено 19 декабря 2018 .
  48. ^ Харпал, Арджун (8 февраля 2018 г.). «Reddit и Pornhub запрещают видео, в которых используется ИИ для наложения лица человека на лицо актера с рейтингом X» . CNBC . Проверено 20 февраля 2018 .
  49. ^ Коул, Саманта (2018-02-06). «Twitter - последняя платформа для запрета порнографии, созданной искусственным интеллектом» . Vice . Проверено 8 ноября 2019 .
  50. ^ Хэтэуэй, Джей (8 февраля 2018 г.). «Вот где« deepfakes », новое фейковое порно знаменитостей, появилось после запрета Reddit» . Daily Dot . Проверено 22 декабря 2018 .
  51. ^ Уолш, Майкл (19 августа 2019 г.). «Технология Deepfake превращает Билла Хадера в Тома Круза» . Ботаник .
  52. ^ Ctrl Shift Face (6 августа 2019 г.). «Билл Хейдер направляет Тома Круза [DeepFake]» .
  53. ^ Мозер, Энди (5 сентября 2019 г.). «Уилл Смит занимает место Киану в« Матрице »в новом дипфейке» . Mashable .
  54. ^ Шамук (3 сентября 2019 г.). «Уилл Смит в роли Нео в« Матрице [DeepFake] » .
  55. ^ «Дипфейки, безопасные для работы» . www.reddit.com .
  56. ^ Тален, Микаэль. «Теперь вы можете сделать дипфейс из себя знаменитости всего за несколько кликов» . ежедневная точка . Проверено 3 апреля 2020 .
  57. ^ а б Ротман, Джошуа. «В эпоху искусственного интеллекта, видя все еще верить?» . Житель Нью-Йорка . Проверено 30 января 2020 года .
  58. ^ Физическая модель мышц для контроля формы рта на IEEE Explore (требуется членство)
  59. ^ Реалистичная трехмерная лицевая анимация в телеконференциях в виртуальном пространстве на IEEE Explore (требуется членство)
  60. ^ Хорев, Рани (26.12.2018). «GAN на основе стилей - создание и настройка реалистичных искусственных лиц» . Lyrn.AI . Проверено 16 февраля 2019 .
  61. ^ Овадья, Авив; Уиттлстоун, Джесс. «Снижение злонамеренного использования синтетических медиа-исследований: соображения и потенциальные практики выпуска для машинного обучения» . researchgate.net . Проверено 30 января 2020 года .
  62. ^ «Сверхбыстрый синтез звука с помощью MelGAN» . Descript.com . Проверено 30 января 2020 года .
  63. ^ «Объединение глубоких символических и необработанных музыкальных моделей аудио» . people.bu.edu .
  64. ^ Линде, Гельмут; Швейцер, Иммануил (5 июля 2019 г.). «Белая книга о будущем искусственного интеллекта» - через ResearchGate.
  65. ^ Энгель, Джесси; Агравал, Кумар Кришна; Чен, Шо; Гульраджани, Ишаан; Донахью, Крис; Робертс, Адам (27 сентября 2018 г.). "GANSynth: Adversarial Neural Audio Synthesis" - через openreview.net.
  66. ^ а б «WaveNet: Генеративная модель для Raw Audio» .
  67. ^ Камбхампати, Суббарао. «Восприятие не будет реальностью, если ИИ сможет манипулировать тем, что мы видим» . Холм . Проверено 30 января 2020 года .
  68. ^ Аллен, Джонатан; Ханникатт, М. Шарон; Клатт, Деннис (1987). От текста к речи: система MITalk . Издательство Кембриджского университета. ISBN 978-0-521-30641-6.
  69. ^ Рубин, П .; Baer, ​​T .; Мермельштейн, П. (1981). «Артикуляционный синтезатор для исследования восприятия». Журнал Акустического общества Америки . 70 (2): 321–328. Bibcode : 1981ASAJ ... 70..321R . DOI : 10.1121 / 1.386780 .
  70. ^ Oyedeji, чудо. «Руководство для новичков по синтетическим медиа и их влиянию на журналистику» . Состояние цифровой публикации . Дата обращения 1 февраля 2020 .
  71. ^ «Дипфейки и синтетические медиа: чего нам бояться? Что мы можем сделать?» . Блог СВИДЕТЕЛЯ . 2018-07-30 . Проверено 12 февраля 2020 .
  72. ^ Кларк, Джек; Брандейдж, Майлз; Солайман, Ирэн. «GPT-2: наблюдение через 6 месяцев» . OpenAI . OpenAI . Дата обращения 1 февраля 2020 .
  73. ^ Полосухин Илья; Кайзер, Лукаш; Gomez, Aidan N .; Джонс, Ллион; Uszkoreit, Jakob; Пармар, Ники; Шазир, Ноам; Васвани, Ашиш (12.06.2017). «Внимание - все, что вам нужно». arXiv : 1706.03762 [ cs.CL ].
  74. ^ Винсент, Джеймс (3 декабря 2018 г.). «Nvidia создала первую демонстрацию видеоигры с использованием графики, созданной искусственным интеллектом» . Грань .
  75. ^ Буг, Джейсон (14 декабря 2019 г.). «Создатель AI Dungeon 2 делится советами по настройке GPT-2» . Средний .
  76. ^ Уолтон, Ник (14 июля 2020 г.). «AI Dungeon: Dragon Model Upgrade» . Средний .
  77. ^ а б Оберхаус, Даниэль (3 декабря 2018 г.). «AI может создавать интерактивные виртуальные миры на основе простых видео» .
  78. ^ "Wenn Merkel plötzlich Trumps Gesicht trägt: die gefährliche Manipulation von Bildern und Videos" . az Aargauer Zeitung. 2018-02-03.
  79. ^ Патрик Генсинг. "Deepfakes: Auf dem Weg in eine alternate Realität?" .
  80. ^ Коул, Саманта; Майберг, Эмануэль; Коблер, Джейсон (26 июня 2019 г.). «Это ужасающее приложение раздевает фотографию любой женщины одним щелчком мыши» . Vice . Дата обращения 2 июля 2019 .
  81. ^ Кокс, Джозеф (9 июля 2019 г.). «GitHub удалил версии DeepNude с открытым исходным кодом» . Vice Media .
  82. ^ "pic.twitter.com/8uJKBQTZ0o" . 27 июня 2019.
  83. ^ «Закон о Deepfake Report 2019» . Congress.gov . Проверено 30 января 2020 года .
  84. ^ «Мошенники использовали ИИ для имитации голоса генерального директора в необычном киберпреступлении» .
  85. ^ а б Янофски, Адам (13.11.2018). «AI может сделать кибератаки более опасными и трудными для обнаружения» . Wall Street Journal .
  86. ^ Ньютон, Кейси. «У запрета дипфейков Facebook есть очевидные обходные пути» . Грань . Проверено 30 января 2020 года .
  87. ^ «Путеводитель по синтетическим медиа 2020» . Блог Paperspace . 17 января 2020.
  88. ^ «Перезапись идет на маленький экран рядом с вами» . Экономист . ISSN  0013-0613 . Проверено 13 февраля 2020 .
  89. ^ «Глобальный охват Netflix вызывает революцию дубляжа:« Общественность требует этого » » . Голливудский репортер . Проверено 13 февраля 2020 .
  90. ^ Рипарбелли, Виктор (23.07.2019). «Наше видение будущего синтетических медиа» . Средний . Проверено 13 февраля 2020 .
  91. ^ «Reuters и Synthesia представляют прототип искусственного интеллекта для автоматизированных видеорепортажей» . Рейтер . 2020-02-07 . Проверено 13 февраля 2020 .
  92. ^ «Могут ли синтетические медиа создавать новый контент? . BBC . 2020-01-29 . Проверено 13 февраля 2020 .
  93. ^ Шао, Грейс (15 октября 2019 г.). «Фейковые видео могут стать следующей большой проблемой на выборах 2020 года» . CNBC .
  94. ^ Гамильтон, Изобель (26 сентября 2019 г.). «Илон Маск предупреждал, что« продвинутый ИИ »может отравить социальные сети» .
  95. ^ «Чат-бот, использующий модель-трансформер OpenAI GPT-2» . dwjbosman.github.io .
  96. ^ Мерчант, Брайан (1 октября 2018 г.). "Когда ИИ становится полным, Джек Керуак" . Атлантика .
  97. ^ Мерчант, Брайан (1 октября 2018 г.). "Когда ИИ становится полным, Джек Керуак" . Атлантика .
  98. ^ Триведи, Чинтан (26 мая 2019 г.). «OpenAI GPT-2 пишет альтернативные концовки для Игры престолов» . Средний .
  99. ^ «Ветеран Pixar создает инструмент искусственного интеллекта для автоматизации 2D-анимации» . 2 июня 2017 г.
  100. ^ Макбрайд, Сара (9 апреля 2019 г.). «Синтетический лагерь - настоящий» . Средний .
  101. ^ а б «Синтезия» . www.synthesia.io . Проверено 12 февраля 2020 .
  102. ^ Бан, Юлий (3 января 2020 г.). «Эпоха воображаемых машин: грядущая демократизация искусства, анимации и воображения» . Средний .
  103. ^ Винсент, Джеймс (2 июля 2019 г.). «Бесконечный спам, созданный искусственным интеллектом, рискует засорить результаты поиска Google» . Грань .
  104. ^ Кемп, Люк (2019-07-08). «Могут ли виртуальные актеры вытеснить людей из бизнеса в эпоху дипфейков?» . Хранитель . ISSN  0261-3077 . Проверено 20 октября 2019 .
  105. ^ Радулович, Петрана (17.10.2018). «Харрисон Форд - звезда Solo: A Star Wars Story благодаря технологии deepfake» . Многоугольник . Проверено 20 октября 2019 .
  106. ^ Виник, Эрин. «Как кукла Кэрри Фишер сделала карьеру для принцессы Леи из Rogue One» . Обзор технологий Массачусетского технологического института . Проверено 20 октября 2019 .
  107. ^ Вонг, Сиси. «Восстание супермоделей искусственного интеллекта» . CDO Trends .
  108. ^ Дитмар, Джулия. «GANs и Deepfakes могут произвести революцию в индустрии моды» . Forbes .
  109. ^ Хамосова, Ленка. «Персонализированная синтетическая реклама - будущее прикладных синтетических медиа» . Средний .
  110. ^ «Генеративный дизайн одежды» .
  111. ^ «AI создает моделей с индивидуальными нарядами и позами» . Синхронизировано . 29 августа 2019.
  112. ^ «Познакомьтесь с Dadabots, дэт-металлической группой AI, которая постоянно играет на Youtube» . Новый Атлас . 23 апреля 2019.
  113. ^ Портер, Джон (26 апреля 2019 г.). «MuseNet OpenAI генерирует музыку AI одним нажатием кнопки» . Грань .
  114. ^ https://www.youtube.com/watch?v=YQAupr7JxNY
  115. ^ Уоттс, Крис. «Вызовы национальной безопасности искусственного интеллекта, манипулируемых СМИ и« дипфейков »- Институт исследований внешней политики» . Проверено 12 февраля 2020 .