Активное обучение - это особый случай машинного обучения, в котором алгоритм обучения может интерактивно запрашивать пользователя (или какой-либо другой источник информации), чтобы пометить новые точки данных желаемыми выходными данными. [1] [2] [3] В статистической литературе это иногда также называют оптимальным экспериментальным планом . [4] Источник информации также называют учителем или оракулом .
Бывают ситуации, когда немаркированных данных много, а ручная маркировка обходится дорого. В таком сценарии алгоритмы обучения могут активно запрашивать у пользователя / учителя ярлыки. Этот тип итеративного обучения с учителем называется активным обучением. Поскольку учащийся выбирает примеры, количество примеров для изучения концепции часто может быть намного меньше, чем количество, требуемое при обычном обучении с учителем. При таком подходе есть риск, что алгоритм перегружен неинформативными примерами. Последние разработки посвящены многокомпонентному активному обучению [5], гибридному активному обучению [6] и активному обучению в однопроходном (интерактивном) контексте [7], объединяющему концепции из области машинного обучения (например, конфликт и незнание) с адаптивным,Политика инкрементального обучения в области машинного обучения онлайн .
Определения
Пусть T будет полным набором всех рассматриваемых данных. Например, в задаче белковой инженерии T будет включать все белки, которые, как известно, обладают определенной интересной активностью, и все дополнительные белки, которые можно захотеть проверить на эту активность.
Во время каждой итерации i , T разбивается на три подмножества
- : Точки данных, в которых известна метка .
- : Точки данных, где метка неизвестна .
- : Подмножество T U, i , которое выбирается для пометки.
Большинство текущих исследований активного обучения включает в себя лучший метод выбора точек данных для T C, i .
Сценарии
- Синтез запроса о членстве : здесь учащийся генерирует свой собственный экземпляр из базового естественного распределения. Например, если набор данных представляет собой изображения людей и животных, учащийся может отправить обрезанное изображение ноги учителю и запросить, принадлежит ли этот придаток животному или человеку. Это особенно полезно, если набор данных небольшой. [8]
- Выборка на основе пула : в этом сценарии экземпляры отбираются из всего пула данных и им присваивается информативная оценка, мера того, насколько хорошо учащийся «понимает» данные. Затем система выбирает наиболее информативные экземпляры и запрашивает у учителя ярлыки.
- Выборочная выборка на основе потока : здесь каждая немаркированная точка данных исследуется по очереди, при этом машина оценивает информативность каждого элемента по параметрам запроса. Учащийся сам решает, присвоить ли ему ярлык или запросить учителя для каждой точки данных.
Стратегии запросов
Алгоритмы определения того, какие точки данных следует пометить, можно разделить на несколько категорий в зависимости от их назначения: [1]
- Баланс исследования и эксплуатации : выбор примеров для обозначения рассматривается как дилемма между исследованием и использованием представления пространства данных. Эта стратегия управляет этим компромиссом, моделируя проблему активного обучения как контекстную проблему бандита. Например, Bouneffouf et al. [9] предлагают последовательный алгоритм под названием Active Thompson Sampling (ATS), который в каждом раунде назначает распределение выборки в пуле, выбирает одну точку из этого распределения и запрашивает у оракула эту метку точки выборки.
- Ожидаемое изменение модели : отметьте те точки, которые больше всего повлияют на текущую модель.
- Ожидаемое уменьшение ошибки : отметьте те точки, которые в наибольшей степени уменьшили бы ошибку обобщения модели .
- Экспоненциальное исследование градиента для активного обучения : [10] В этой статье автор предлагает последовательный алгоритм под названием экспоненциальный градиент (EG) -активный, который может улучшить любой алгоритм активного обучения путем оптимального случайного исследования.
- Выборка неопределенности : отметьте те точки, для которых текущая модель наименее уверена в том, каким должен быть правильный результат.
- Запрос по комитету : различные модели обучаются на текущих помеченных данных и голосуют за результат для немаркированных данных; обозначьте те пункты, по которым "комитет" не согласен больше всего
- Запросы из различных подпространств или разделов : [11] Когда базовая модель представляет собой лес деревьев, конечные узлы могут представлять (перекрывающиеся) разделы исходного пространства функций . Это дает возможность выбора экземпляров из неперекрывающихся или минимально перекрывающихся разделов для маркировки.
- Уменьшение отклонения : отметьте те точки, которые позволят минимизировать отклонение результатов, которое является одним из компонентов ошибки.
- Конформные предикторы : этот метод предсказывает, что новая точка данных будет иметь метку, подобную старым точкам данных некоторым определенным образом, и степень сходства в старых примерах используется для оценки достоверности прогноза. [12]
- Mismatch-first farthest-traversal : Первичный критерий выбора - это несоответствие прогноза между текущей моделью и прогнозом ближайшего соседа. Он нацелен на ошибочно предсказанные точки данных. Второй критерий выбора - это расстояние до ранее выбранных данных, сначала самые дальние. Он направлен на оптимизацию разнообразия выбранных данных. [13]
Было изучено множество алгоритмов, которые попадают в эти категории. [1] [4]
Хотя традиционные стратегии AL могут обеспечить замечательную производительность, часто бывает сложно заранее предсказать, какая стратегия будет наиболее подходящей в конкретной ситуации. В последние годы набирают популярность алгоритмы метаобучения. Некоторые из них были предложены для решения проблемы изучения стратегий AL вместо того, чтобы полагаться на стратегии, разработанные вручную [14] [15] [16]
Минимальная маргинальная гиперплоскость
Некоторые алгоритмы активного обучения построены на машинах опорных векторов (SVM) и используют структуру SVM для определения того, какие точки данных следует маркировать. Такие методы , как правило , вычислить запас , W , каждый элемент данных в немеченом T U, I и обрабатывают W как п - мерное расстояние от опорной точки на эту разделяющую гиперплоскость.
Методы минимальной маргинальной гиперплоскости предполагают, что данные с наименьшим W - это те данные, в отношении которых SVM больше всего сомневается, и поэтому их следует поместить в T C, i для маркировки. Другие подобные методы, такие как максимальные Маргинальные гиперплоскости, выберите данные с наибольшим W . Методы компромисса выбирают сочетание наименьшего и наибольшего W s.
Смотрите также
Заметки
- ^ a b c Settles, Burr (2010). «Обзор литературы для активного обучения» (PDF) . Технический отчет по информатике 1648. Университет Висконсина-Мэдисона . Проверено 18 ноября 2014 . Цитировать журнал требует
|journal=
( помощь ) - ^ Рубенс, Нил; Элахи, Мехди; Сугияма, Масаси; Каплан, Дайн (2016). «Активное обучение в рекомендательных системах». В Риччи, Франческо; Рокач, Лиор; Шапира, Браха (ред.). Справочник рекомендательных систем (PDF) (2-е изд.). Springer США. DOI : 10.1007 / 978-1-4899-7637-6 . ЛВП : 11311/1006123 . ISBN 978-1-4899-7637-6. S2CID 11569603 .
- ^ Дас, Шубхомой; Вонг, Вен-Кин; Диттерих, Томас; Ферн, Алан; Эммотт, Эндрю (2016). «Включение отзывов экспертов в процесс обнаружения активных аномалий». В Бонки, Франческо; Доминго-Феррер, Жозеп; Баеза-Йейтс, Рикардо; Чжоу, Чжи-Хуа; У, Синьдун (ред.). IEEE 16-я Международная конференция по интеллектуальному анализу данных . IEEE. С. 853–858. DOI : 10.1109 / ICDM.2016.0102 . ISBN 978-1-5090-5473-2. S2CID 15285595 .
- ^ а б Олссон, Фредрик (апрель 2009 г.). «Обзор литературы по активному машинному обучению в контексте обработки естественного языка» . Технический отчет SICS T2009: 06. Цитировать журнал требует
|journal=
( помощь ) - ^ Ян, Бишань; Сунь, Цзянь-Тао; Ван, Тэнцзяо; Чен, Чжэн (2009). «Эффективное многокомпонентное активное обучение для классификации текста» (PDF) . Материалы 15-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных - KDD '09 . п. 917. CiteSeerX 10.1.1.546.9358 . DOI : 10.1145 / 1557019.1557119 . ISBN 978-1-60558-495-9. S2CID 1979173 .
- ^ Лугхофер, Эдвин (февраль 2012 г.). «Гибридное активное обучение для уменьшения усилий операторов по аннотации в системах классификации». Распознавание образов . 45 (2): 884–896. DOI : 10.1016 / j.patcog.2011.08.009 .
- ^ Лугхофер, Эдвин (2012). «Однопроходное активное обучение с конфликтом и незнанием». Развивающиеся системы . 3 (4): 251–271. DOI : 10.1007 / s12530-012-9060-7 . S2CID 43844282 .
- ^ Ван, Ляньтао; Ху, Сюэлей; Юань, Бо; Лу, Цзяньфэн (05.01.2015). «Активное обучение посредством синтеза запросов и поиска ближайшего соседа» (PDF) . Нейрокомпьютеры . 147 : 426–434. DOI : 10.1016 / j.neucom.2014.06.042 .
- ^ Бунефуф, Джаллель; Ларош, Ромен; Урвой, Танги; Феро, Рафаэль; Аллезиардо, Робин (2014). «Контекстный бандит для активного обучения: Активный Томпсон» . Ин Лоо, СК; Яп, Канзас; Вонг, кВт; Teoh, A .; Хуанг, К. (ред.). Обработка нейронной информации (PDF) . Конспект лекций по информатике. 8834 . С. 405–412. DOI : 10.1007 / 978-3-319-12637-1_51 . ISBN 978-3-319-12636-4. Идентификатор HAL: hal-01069802.
- ^ Бунефуф, Джаллель (8 января 2016 г.). «Экспоненциальное исследование градиента для активного обучения». Компьютеры . 5 (1): 1. arXiv : 1408.2196 . DOI : 10.3390 / computers5010001 . S2CID 14313852 .
- ^ "шубхомойдас / ad_examples" . GitHub . Проверено 4 декабря 2018 .
- ^ Макили, Ласаро Эмилио; Санчес, Хесус А. Вега; Дормидо-Канто, Себастьян (01.10.2012). «Активное обучение с использованием конформных предикторов: приложение к классификации изображений». Наука и технология термоядерного синтеза . 62 (2): 347–355. DOI : 10.13182 / FST12-A14626 . ISSN 1536-1055 . S2CID 115384000 .
- ^ Чжао, Шуян; Хейттола, Тони; Виртанен, Туомас (2020). «Активное обучение для обнаружения звуковых событий». Транзакции IEEE / ACM по обработке звука, речи и языка . arXiv : 2002.05033 .
- ^ Конюшкова, К .; Sznitman, R .; Фуа, П. (2017). «Активное обучение на основе данных». Достижения в системах обработки нейронной информации . arXiv : 1703.03365 .
- ^ Desreumaux, Луи; Лемэр, Винсент (2020). «Обучение активному обучению на распутье? Оценка и обсуждение». Интерактивное адаптивное обучение, ECML-PKDD, 2020 . arXiv : 2012.09631 .
- ^ Конюшкова, К .; Sznitman, R .; Фуа, П. (2019). «Обнаружение универсальных стратегий активного обучения». arXiv : 1810.04114 . Цитировать журнал требует
|journal=
( помощь )