Генеративный искусственный интеллект

Генеративный искусственный интеллект или генеративный ИИ — это тип системы искусственного интеллекта (ИИ), способной генерировать текст, изображения или другие медиаданные в ответ на подсказки . ^[1]^[2] Генеративные модели ИИ изучают шаблоны и структуру своих входных обучающих данных , а затем генерируют новые данные со схожими характеристиками. ^[3]^[4]

Известные генеративные системы искусственного интеллекта включают ChatGPT (и его вариант Bing Chat ), чат-бот , созданный OpenAI с использованием их основных языковых моделей GPT-3 и GPT-4 , ^[5] и Bard , чат-бот, созданный Google с использованием их базовой модели LaMDA . ^[6]Другие модели генеративного ИИ включают в себя художественные системы искусственного интеллекта, такие как Stable Diffusion , Midjourney и DALL-E . ^[7]

Генеративный ИИ может применяться в самых разных отраслях, включая искусство, письмо, разработку программного обеспечения, дизайн продуктов, здравоохранение, финансы, игры, маркетинг и моду. ^[8]^[9]^[10]Инвестиции в генеративный ИИ резко выросли в начале 2020-х годов, когда крупные компании, такие как Microsoft, Google и Baidu, а также многочисленные более мелкие фирмы разрабатывали модели генеративного ИИ. ^[1]^[11]^[12] Тем не менее, существуют также опасения по поводу потенциального неправомерного использования генеративного ИИ, например, для создания фейковых новостей или дипфейков , которые могут использоваться для обмана или манипулирования людьми. ^[13]

С момента своего основания область машинного обучения использовала статистические модели , в том числе генеративные модели , для моделирования и прогнозирования данных. Начиная с конца 2000-х годов появление глубокого обучения привело к прогрессу и исследованиям в области обработки изображений и видео, анализа текста, распознавания речи и других задач. Однако большинство глубоких нейронных сетей были обучены как дискриминационные модели, выполняющие задачи классификации, такие как классификация изображений на основе сверточной нейронной сети .

В 2014 году такие достижения, как вариационный автоэнкодер и генеративно-состязательная сеть, привели к появлению первых практических глубоких нейронных сетей, способных изучать генеративные, а не дискриминационные модели сложных данных, таких как изображения. Эти глубокие генеративные модели были первыми, способными выводить не только метки классов для изображений, но и выводить целые изображения.

В 2017 году сеть Transformer позволила продвинуться в ^{генеративных} моделях, что привело к появлению первого предварительно обученного генеративного преобразователя в 2018 году . модель . ^[16]

Пикетчик на забастовке Гильдии писателей Америки 2023 года . Хотя это и не было главным приоритетом, одним из запросов WGA на 2023 год было «правило использования (генеративного) ИИ». ^[14]

Théâtre d'Opéra Spatial , изображение, созданное Midjourney