Генеративный искусственный интеллект


Генеративный искусственный интеллект или генеративный ИИ — это тип системы искусственного интеллекта (ИИ), способной генерировать текст, изображения или другие медиаданные в ответ на подсказки . [1] [2] Генеративные модели ИИ изучают шаблоны и структуру своих входных обучающих данных , а затем генерируют новые данные со схожими характеристиками. [3] [4]

Известные генеративные системы искусственного интеллекта включают ChatGPT (и его вариант Bing Chat ), чат-бот , созданный OpenAI с использованием их основных языковых моделей GPT-3 и GPT-4 , [5] и Bard , чат-бот, созданный Google с использованием их базовой модели LaMDA . [6]Другие модели генеративного ИИ включают в себя художественные системы искусственного интеллекта, такие как Stable Diffusion , Midjourney и DALL-E . [7]

Генеративный ИИ может применяться в самых разных отраслях, включая искусство, письмо, разработку программного обеспечения, дизайн продуктов, здравоохранение, финансы, игры, маркетинг и моду. [8] [9] [10]Инвестиции в генеративный ИИ резко выросли в начале 2020-х годов, когда крупные компании, такие как Microsoft, Google и Baidu, а также многочисленные более мелкие фирмы разрабатывали модели генеративного ИИ. [1] [11] [12] Тем не менее, существуют также опасения по поводу потенциального неправомерного использования генеративного ИИ, например, для создания фейковых новостей или дипфейков , которые могут использоваться для обмана или манипулирования людьми. [13]

С момента своего основания область машинного обучения использовала статистические модели , в том числе генеративные модели , для моделирования и прогнозирования данных. Начиная с конца 2000-х годов появление глубокого обучения привело к прогрессу и исследованиям в области обработки изображений и видео, анализа текста, распознавания речи и других задач. Однако большинство глубоких нейронных сетей были обучены как дискриминационные модели, выполняющие задачи классификации, такие как классификация изображений на основе сверточной нейронной сети .

В 2014 году такие достижения, как вариационный автоэнкодер и генеративно-состязательная сеть, привели к появлению первых практических глубоких нейронных сетей, способных изучать генеративные, а не дискриминационные модели сложных данных, таких как изображения. Эти глубокие генеративные модели были первыми, способными выводить не только метки классов для изображений, но и выводить целые изображения.

В 2017 году сеть Transformer позволила продвинуться в генеративных моделях, что привело к появлению первого предварительно обученного генеративного преобразователя в 2018 году . модель . [16]


Пикетчик на забастовке Гильдии писателей Америки 2023 года . Хотя это и не было главным приоритетом, одним из запросов WGA на 2023 год было «правило использования (генеративного) ИИ». [14]
Théâtre d'Opéra Spatial , изображение, созданное Midjourney