Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Автоматическое обнаружение взаимодействия хи-квадрат ( CHAID ) - это метод дерева решений , основанный на скорректированном тестировании значимости ( тестирование Бонферрони ). Этот метод был разработан в Южной Африке и опубликован в 1980 году Гордоном В. Кассом, который защитил докторскую диссертацию по этой теме. CHAID может использоваться для прогнозирования (аналогично регрессионному анализу).(эта версия CHAID изначально была известна как XAID), а также классификации и обнаружения взаимодействия между переменными. CHAID основан на формальном расширении американских процедур AID (автоматическое обнаружение взаимодействия) и THAID (автоматическое обнаружение взаимодействия THeta) 1960-х и 1970-х годов, которые, в свою очередь, были расширением более ранних исследований, в том числе проведенных в Великобритании в США. 1950-е годы.

На практике CHAID часто используется в контексте прямого маркетинга для отбора групп потребителей и прогнозирования того, как их реакция на некоторые переменные влияет на другие переменные, хотя другие ранние применения были в области медицинских и психиатрических исследований.

Как и другие деревья решений, преимущества CHAID заключаются в том, что его выходные данные наглядны и легко интерпретируются. Поскольку по умолчанию используется многовариантное разбиение, для эффективной работы требуются довольно большие размеры выборки, поскольку при малых размерах выборки группы респондентов могут быстро стать слишком маленькими для надежного анализа.

Одним из важных преимуществ CHAID перед такими альтернативами, как множественная регрессия, является то, что он не является параметрическим.

См. Также [ править ]

Ссылки [ править ]

Дальнейшее чтение [ править ]

  • Belson, William A .; Сопоставление и прогнозирование по принципу биологической классификации , Прикладная статистика, Vol. 8 (1959), стр. 65–75
  • Морган, Джон А .; И Сонквист, Джеймс Н .; Проблемы анализа данных опроса и предложения , Журнал Американской статистической ассоциации , Vol. 58 (1963), стр. 415–434
  • Press, Laurence I .; Роджерс, Майлз С .; И Shure, Джеральд Х .; Интерактивный метод анализа многомерных данных , Behavioral Science, Vol. 14 (1969), стр. 364–370
  • Касс, Гордон В .; Исследовательская техника для исследования больших объемов категориальных данных , Прикладная статистика, Vol. 29, № 2 (1980), стр. 119–127.
  • Хокинс, Дуглас М.; и Касс, Гордон В .; Автоматическое обнаружение взаимодействия , Хокинс, Дуглас М. (редактор), Темы прикладного многомерного анализа , Cambridge University Press, Кембридж, 1982, стр. 269–302.
  • Hooton, Thomas M .; Хейли, Роберт В .; Калвер, Дэвид Х .; Уайт, Джон В .; Морган, У. Мид; И Кэрролл, Раймонд Дж .; Совместные ассоциации множественных факторов риска с возникновением нозокомиальных инфекций , Американский медицинский журнал, Vol. 70, (1981), стр. 960–970.
  • Бринк, Сюзанна; И Ван Шалквик, Дирк Дж .; Ферритин сыворотки и средний корпускулярный объем как предикторы запасов железа в костном мозге , South African Medical Journal, Vol. 61, (1982), стр. 432–434.
  • Маккензи, Дин П .; МакГорри, Патрик Д .; Уоллес, Крис С .; Low, Lee H .; Кополов, Дэвид Л .; И Сингх, Брюс С .; Построение минимального диагностического дерева решений , методы информации в медицине, Vol. 32 (1993), стр. 161–166.
  • Мэджидсон, Джей; Подход CHAID к моделированию сегментации: автоматическое обнаружение взаимодействия хи-квадрат , у Bagozzi, Richard P. (ed); Передовые методы маркетинговых исследований , Блэквелл, Оксфорд, Великобритания, 1994, стр. 118–159.
  • Хокинс, Дуглас М .; Янг, СС; И Росинко, А .; Анализ большого набора данных структура-деятельность с использованием рекурсивного разбиения , Quantitative Structure-Activity Relationships, Vol. 16, (1997), стр. 296–302.

Источники [ править ]

  • Лучман, JN; CHAID: модуль Stata для автоматического определения взаимодействия по хи-квадрат. Доступно для бесплатной загрузки или введите в Stata: ssc install chaid.
  • Лучман, JN; CHAIDFOREST: модуль Stata для проведения случайной классификации ансамблей лесов на основе автоматического определения взаимодействия хи-квадрат (CHAID) в качестве базового обучающегося , доступен для бесплатной загрузки или введите в Stata: ssc install chaidforest.