Эта статья может быть слишком технической, чтобы ее могло понять большинство читателей . Февраль 2015 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) ( |
Адаптация домена [1] [2] [3] - это область, связанная с машинным обучением и трансферным обучением . Этот сценарий возникает, когда мы стремимся изучить из исходного распределения данных хорошо работающую модель на другом (но связанном) целевом распределении данных. Например, одна из задач общей проблемы фильтрации спама состоит в адаптации модели от одного пользователя (исходное распределение) к новому пользователю, который получает существенно разные электронные письма (целевое распределение). Адаптация предметной области также оказалась полезной для изучения несвязанных источников. [4] Обратите внимание, что, когда доступно более одного распределения источника, проблема упоминается как адаптация домена с несколькими источниками.[5]
Обзор [ править ]
Адаптация домена - это способность применять алгоритм, обученный в одном или нескольких «исходных доменах», к другому (но связанному) «целевому домену». Адаптация предметной области - это подкатегория трансферного обучения. При адаптации домена исходный и целевой домены имеют одно и то же пространство функций (но разные распределения); Напротив, трансферное обучение включает случаи, когда пространство признаков целевого домена отличается от пространства или пространств исходных объектов. [6]
Сдвиг домена [ править ]
Сдвиг домена , [7] или дистрибутивный сдвиг , [8] представляет собой изменение в распределении данных между обучающим набором данными алгоритма , , и набором данными он сталкивается при развертывании. Эти сдвиги доменов обычны в практических приложениях искусственного интеллекта. Обычные алгоритмы машинного обучения часто плохо адаптируются к сдвигам предметной области. У современного сообщества машинного обучения есть много разных стратегий, чтобы попытаться улучшить адаптацию предметной области. [7]
Примеры [ править ]
- Алгоритм, обученный в новостных лентах, возможно, придется адаптировать к новому набору данных биомедицинских документов. [9]
- Спам-фильтр, обученный определенной группе пользователей электронной почты во время обучения, должен адаптироваться к новому целевому пользователю при развертывании. [10]
- Применение диагностических алгоритмов ИИ, обученных на размеченных данных, связанных с предыдущими заболеваниями, к новым немаркированным данным, связанным с пандемией COVID-19 . [11]
- Внезапные изменения в обществе, такие как вспышка пандемии, могут представлять собой сдвиг в предметной области и приводить к сбою алгоритмов машинного обучения, обученных на уже устаревших данных потребителей, и необходимости вмешательства. [12] [13]
Другие приложения включают обнаружение локализации Wi-Fi и многие аспекты компьютерного зрения . [6]
Формализация [ править ]
Пусть будет входным пространством (или пространством описания) и пусть будет выходным пространством (или пространством меток). Цель алгоритма машинного обучения - изучить математическую модель (гипотезу), способную прикрепить метку от к примеру от . Эта модель изучена на обучающей выборке .
Обычно при обучении с учителем (без адаптации предметной области) мы предполагаем, что примеры взяты из некоторого распределения поддержки (неизвестного и фиксированного). Затем цель состоит в том, чтобы научиться (из ) таким образом, чтобы он допускал наименьшие возможные ошибки при маркировке новых примеров, поступающих из дистрибутива .
Основное различие между обучением с учителем и адаптацией предметной области состоит в том, что в последней ситуации мы изучаем два разных (но связанных) распределения и на [ необходима ссылка ] . Тогда задача адаптации домена состоит из передачи знаний из исходного домена в целевой . Затем цель состоит в том, чтобы научиться (из меченых или немаркированных образцов, поступающих из двух доменов), чтобы он допускал как можно меньше ошибок в целевом домене [ необходима цитата ] .
Основная проблема заключается в следующем: если модель извлекается из исходного домена, какова ее способность правильно маркировать данные, поступающие из целевого домена?
Различные типы адаптации домена [ править ]
Есть несколько контекстов адаптации домена. Они различаются информацией, учитываемой для целевой задачи.
- Адаптации без присмотра домена : Обучающееся образец содержит набор меченых примеров источника, набор примеров немеченых источников и набор примеров немеченых мишеней.
- Адаптация полуобучаемого домена : в этой ситуации, мы также рассмотрим «небольшой» набор меченых целевых примеров.
- Адаптация контролируемого домена : все Рассмотренные примеры должны быть промаркированы.
Четыре алгоритмических принципа [ править ]
Алгоритмы повторного взвешивания [ править ]
Задача состоит в том, чтобы повторно взвесить исходную маркированную выборку, чтобы она «выглядела» как целевая выборка (с точки зрения рассматриваемой меры погрешности). [14] [15]
Итерационные алгоритмы [ править ]
Метод адаптации состоит в итеративном "автоматическом пометке" целевых примеров. Принцип прост:
- модель узнается из помеченных примеров;
- автоматически помечает некоторые целевые примеры;
- новая модель узнается из новых помеченных примеров.
Обратите внимание, что существуют и другие итерационные подходы, но для них обычно требуются примеры с пометкой цели. [16] [17]
Поиск общего пространства представления [ править ]
Цель состоит в том, чтобы найти или построить общее пространство представления для двух областей. Цель состоит в том, чтобы получить пространство, в котором домены расположены близко друг к другу, при сохранении хорошей производительности задачи маркировки источников. Это может быть достигнуто за счет использования методов состязательного машинного обучения, при которых рекомендуется, чтобы представления функций из образцов в разных областях были неразличимы. [18] [19]
Иерархическая байесовская модель [ править ]
Цель состоит в том, чтобы построить байесовскую иерархическую модель , которая, по сути, является моделью факторизации для подсчетов , чтобы вывести зависящие от предметной области латентные представления, допускающие как специфические для предметной области, так и глобально общие латентные факторы. [4]
Ссылки [ править ]
- ^ Редько, Евгений; Морвант, Эмили; Хабрард, Амори; Себбан, Марк; Беннани, Юнес (2019). Успехи в теории адаптации предметной области . ISTE Press - Elsevier. п. 187. ISBN. 9781785482366.
- ^ Уздечка, Джон С .; Кокс, Стивен Дж (1990). «RecNorm: одновременная нормализация и классификация, применяемые к распознаванию речи» (PDF) . Конференция по нейронным системам обработки информации (NIPS) . С. 234–240.
- ↑ Бен-Давид, Шай; Блитцер, Джон; Краммер, Коби; Кулеша, Алекс; Перейра, Фернандо; Вортман Воган, Дженнифер (2010). «Теория обучения из разных областей» (PDF) . Машинное обучение . 79 (1–2): 151–175. DOI : 10.1007 / s10994-009-5152-4 .
- ^ a b Хаджирамезанали, Эхсан; Сиамак Замани Дадане; Карбалайгарах, Алиреза; Чжоу, Минъюань; Цянь, Сяонин (2018). «Байесовское многодоменное обучение для обнаружения подтипа рака на основе данных секвенирования следующего поколения». arXiv : 1810.09433 [ stat.ML ].
- ^ Краммер, Коби; Кирнс, Майкл; Вортман, Дженифер (2008). «Обучение из разных источников» (PDF) . Журнал исследований в области машинного обучения . 9 : 1757–1774.
- ^ а б Сунь, Шилян; Ши, Хунлей; У Юаньбинь (июль 2015 г.). «Обзор адаптации домена с несколькими источниками». Информационный фьюжн . 24 : 84–92. DOI : 10.1016 / j.inffus.2014.12.003 .
- ^ a b Сун, Баочен, Цзиаши Фэн и Кейт Саенко. «Возвращение удручающе простой адаптации домена». На тридцатой конференции AAAI по искусственному интеллекту. 2016 г.
- ^ Amodei, Dario, Крис Олы, Джейкоб Стейнхардт, Пол Кристиано~d, Джон Шульман, и Дэн Мане. «Конкретные проблемы безопасности ИИ». Препринт arXiv arXiv: 1606.06565 (2016).
- ^ Дауме III, Hal. «Удивительно простая адаптация домена». Препринт arXiv arXiv: 0907.1815 (2009).
- ^ Бен-Давид, Шай, Джон Blitzer, Коби Crammer и Фернандо Перейра. «Анализ представлений для адаптации предметной области». В "Достижения в системах обработки нейронной информации", стр. 137-144. 2007 г.
- ^ Ху, Ипэн; Иаков, Иосиф; Паркер, Джеффри Дж. М.; Хоукс, Дэвид Дж .; Херст, Джон Р .; Стоянов, Данаил (июнь 2020 г.). «Проблемы развертывания моделей искусственного интеллекта в условиях быстро развивающейся пандемии» . Природа Машинный интеллект . 2 (6): 298–300. DOI : 10.1038 / s42256-020-0185-2 . ISSN 2522-5839 .
- ↑ Мэтьюз, Дилан (26 марта 2019 г.). «ИИ-катастрофа не будет похожа на Терминатора. Она будет более жуткой» . Vox . Проверено 21 июня 2020 .
- ^ «Наше странное поведение во время пандемии противоречит моделям ИИ» . Обзор технологий Массачусетского технологического института . 11 мая 2020 . Проверено 21 июня 2020 .
- ^ Хуанг, Цзяюань; Смола, Александр Дж .; Греттон, Артур; Borgwardt, Karster M .; Шёлкопф, Бернхард (2006). «Корректировка смещения выборки с помощью немаркированных данных» (PDF) . Конференция по нейронным системам обработки информации (NIPS) . С. 601–608.
- ^ Shimodaira, Хидэтоси (2000). «Улучшение прогнозного вывода при ковариатном сдвиге путем взвешивания функции логарифма правдоподобия» . Журнал статистического планирования и вывода . 90 (2): 227–244. DOI : 10.1016 / S0378-3758 (00) 00115-4 .
- ^ Ариф-Анг, IB; Салим, ФО; Гамильтон, М. (8 ноября 2017 г.). DA-HOC: адаптация полууправляемой области для прогнозирования занятости комнаты с использованием данных датчика CO2 . 4-я Международная конференция ACM по системам для энергоэффективных построенных сред (BuildSys). Делфт, Нидерланды. С. 1–10. DOI : 10.1145 / 3137133.3137146 . ISBN 978-1-4503-5544-5.
- ^ Ариф-Анг, IB; Гамильтон, М .; Салим, ФО (2018-12-01). «Масштабируемое прогнозирование занятости комнаты с переносимым разложением временного ряда данных датчика CO2». ACM-транзакции в сенсорных сетях . 14 (3–4): 21: 1–21: 28. DOI : 10.1145 / 3217214 .
- ^ Ганин, Ярослав; Устинова, Евгения; Аджакан, Хана; Жермен, Паскаль; Ларошель, Хьюго; Лавиолетт, Франсуа; Маршан, Марио; Лемпицкий, Виктор (2016). «Предметно-состязательное обучение нейронных сетей» (PDF) . Журнал исследований в области машинного обучения . 17 : 1–35.
- ^ Hajiramezanali, Ehsan; Сиамак Замани Дадане; Карбалайгарах, Алиреза; Чжоу, Минъюань; Цянь, Сяонин (2017). «Решение проблемы изменения внешнего вида в наружной робототехнике с адаптацией противоборства». arXiv : 1703.01461 [ cs.RO ].