Ассоциативный классификатор (АС) является своим родом подконтрольного обучения модели , которая использует ассоциативные правила для назначения целевого значения. Термин ассоциативная классификация был введен Бингом Лю и др. [1], в котором авторы определили модель, состоящую из правил, «правая часть которых ограничена атрибутом класса классификации».
Модель
Модель, созданная AC и используемая для маркировки новых записей, состоит из правил ассоциации , где консеквент соответствует метке класса. Таким образом, их также можно рассматривать как список предложений «если-то»: если запись соответствует некоторым критериям (выраженным в левой части правила, также называемым антецедентом), она затем помечается в соответствии с классом в правая часть правила (или следствия).
Большинство AC читают список правил по порядку и применяют первое правило сопоставления, чтобы пометить новую запись. [2]
Более поздние подходы сформулировали проблему оптимального комбинирования предварительно разработанных ассоциативных правил в списке решений или списке правил. В этих методах используются разные формы бритвы Оккама (правило экономии), и их можно разделить на три основных типа на основе используемой теории:
- Регуляризованные потери (точность с норма) [3]
- Байесовская статистика [4] [5]
- Принцип минимальной длины описания (MDL) [6]
\ end {enumerate} Первый подход находит списки решений и решает проблему оптимальным образом с помощью алгоритма ветвей и границ. Второй находит список вероятностных правил для двоичной классификации и прибегает к методу Монте-Карло цепей Маркова (MCMC), который приблизительно решает проблему, поскольку принимает только небольшое количество предварительно разработанных правил. Третий также находит список вероятностных правил, хотя и для мультиклассовой классификации, и использует жадный алгоритм для масштабирования для больших наборов данных.
Метрики
Правила AC наследуют некоторые метрики правил ассоциации, такие как поддержка или доверие. [7] Метрики можно использовать для упорядочивания или фильтрации правил в модели [8] и для оценки их качества.
Реализации
Первым предложением модели классификации, состоящей из ассоциативных правил, был CBA [1], хотя другие авторы ранее предлагали анализ ассоциативных правил для классификации. [9] С тех пор другие авторы предложили несколько изменений к исходной модели, например, добавление фазы сокращения избыточных правил [10] или использование Emerging Patterns. [11]
Известные реализации включают:
Рекомендации
- ^ а б Лю, Бинг; Сюй, Винн; Ма, Имин (1998). «Интеграция классификации и ассоциативного майнинга»: 80––86. CiteSeerX 10.1.1.48.8380 . Цитировать журнал требует
|journal=
( помощь ) - ^ Табтах, Фади (2007). «Обзор ассоциативной классификации интеллектуального анализа данных» (PDF) . Обзор инженерии знаний . 22 (1): 37–65. DOI : 10.1017 / s0269888907001026 . ISSN 0269-8889 .
- ^ Анджелино, Элейн; Ларус-Стоун, Николай; Алаби, Даниэль; Зельцер, Марго; Рудин, Синтия (1 января 2017 г.). «Изучение гарантированно оптимальных списков правил для категориальных данных» . Журнал исследований в области машинного обучения . 18 (1): 8753–8830. arXiv : 1704.01701 . ISSN 1532-4435 .
- ^ Летэм, Бенджамин; Рудин, Синтия; McCormick, Tyler H .; Мэдиган, Дэвид (сентябрь 2015 г.). «Интерпретируемые классификаторы с использованием правил и байесовского анализа: построение лучшей модели прогнозирования инсульта» . Анналы прикладной статистики . 9 (3): 1350–1371. arXiv : 1511.01644 . DOI : 10.1214 / 15-AOAS848 . ISSN 1932-6157 . S2CID 17699665 .
- ^ Ян, Хунъюй; Рудин, Синтия; Зельцер, Марго (17 июля 2017 г.). «Масштабируемые списки байесовских правил» . Международная конференция по машинному обучению . PMLR: 3921–3930. arXiv : 1602.08610 .
- ^ Proença, Hugo; ван Леувен, Маттейс (май 2019 г.). «Интерпретируемая мультиклассовая классификация по спискам правил на основе MDL». Информационные науки . 512 : 1372–1393. arXiv : 1905.00328 . DOI : 10.1016 / j.ins.2019.10.050 . S2CID 141461238 .
- ^ Ляо, Т. Уоррен; Триантафиллу, Евангелос (2008). Последние достижения в области интеллектуального анализа корпоративных данных: алгоритмы и приложения . Серия по компьютерам и исследованиям операций. МИРОВАЯ НАУЧНАЯ. DOI : 10,1142 / 6689 . ISBN 9789812779854. S2CID 34599426 .
- ^ "Домашняя страница ЦБ" . Проверено 4 октября 2018 .
- ^ Али, Камаль; Манганарис, Стефанос; Срикант, Рамакришнан (14 августа 1997 г.). «Частичная классификация с использованием ассоциативных правил» . KDD'97. AAAI Press: 115–118. Цитировать журнал требует
|journal=
( помощь ) - ^ а б Венмин Ли; Цзявэй Хан; Цзянь Пей (2001). CMAR: точная и эффективная классификация, основанная на нескольких правилах ассоциации классов . Материалы Международной конференции IEEE 2001 по интеллектуальному анализу данных . IEEE Comput. Soc. С. 369–376. CiteSeerX 10.1.1.13.219 . DOI : 10.1109 / icdm.2001.989541 . ISBN 978-0769511191. S2CID 2243455 .
- ^ а б Дун, Гочжу; Чжан, Сючжэнь; Вонг, Лимсун; Ли, Jinyan (1999), "САЕР: Классификация Агрегируя Emerging Patterns" , Discovery Science ., Springer Berlin Heidelberg, стр 30-42 , CiteSeerX 10.1.1.37.3226 , DOI : 10.1007 / 3-540-46846-3_4 , ISBN 9783540667131
- ^ «Внедрение CMAR» . cgi.csc.liv.ac.uk . Проверено 4 октября 2018 .
- ^ Инь, Сяосинь; Хан, Цзявэй (2003), «CPAR: Классификация на основе правил прогнозирующей ассоциации», Труды Международной конференции SIAM 2003 года по интеллектуальному анализу данных , Общество промышленной и прикладной математики, стр. 331–335, CiteSeerX 10.1.1.12.7268 , doi : 10.1137 / 1.9781611972733.40 , ISBN 9780898715453
- ^ "РЕАЛИЗАЦИЯ LUCS-KDD АЛГОРИТМОВ FOIL, PRM И CPAR" . cgi.csc.liv.ac.uk . Проверено 4 октября 2018 .
- ^ Baralis, E .; Chiusano, S .; Гарза, П. (2008). «Ленивый подход к ассоциативной классификации». IEEE Transactions по разработке знаний и данных . 20 (2): 156–171. DOI : 10,1109 / tkde.2007.190677 . ISSN 1041-4347 . S2CID 14829459 .
- ^ «Реализация L3» . dbdmg.polito.it . Проверено 8 октября 2018 .
- ^ Чен, Гоцин; Лю, Хунъянь; Ю, Лань; Вэй, Цян; Чжан, Син (2006). «Новый подход к классификации, основанный на интеллектуальном анализе ассоциативных правил». Системы поддержки принятия решений . 42 (2): 674–689. DOI : 10.1016 / j.dss.2005.03.005 . ISSN 0167-9236 .
- ^ Ван, Кэ; Чжоу, Сенцян; Он, Ю (2000). Выращивание деревьев решений по правилам ассоциации без поддержки . Труды Шестой Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных - KDD '00 . Нью-Йорк, Нью-Йорк, США: ACM Press. CiteSeerX 10.1.1.36.9265 . DOI : 10.1145 / 347090.347147 . ISBN 978-1581132335. S2CID 8296096 .