Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Пример изотонической регрессии (сплошная красная линия) по сравнению с линейной регрессией на тех же данных, оба подходят для минимизации среднеквадратичной ошибки . Свойство произвольной формы изотонической регрессии означает, что линия может быть круче там, где круче данные; ограничение изотоничности означает, что линия не уменьшается.

В статистике , изотонические регрессии или монотонная регрессия является методом подгонки свободной формы линии к последовательности наблюдений таким образом, что встроенная линия не убывает (или не возрастает) всюду, и ложь как можно ближе к наблюдениям , как это возможно.

Приложения [ править ]

Изотоническая регрессия имеет применение в статистических выводах . Например, его можно использовать для подгонки изотонической кривой к средним значениям некоторого набора экспериментальных результатов, когда ожидается увеличение этих средних значений в соответствии с определенным порядком. Преимущество изотонической регрессии состоит в том, что она не ограничена какой-либо функциональной формой, такой как линейность, налагаемая линейной регрессией , пока функция является монотонно возрастающей.

Другое применение неметрического многомерное масштабирование , [1] , где маломерная вложение для точек данных ищутся таким образом, что порядок расстояний между точками в вложении матчей порядка несходства между точками. Изотоническая регрессия используется итеративно для подбора идеальных расстояний для сохранения порядка относительного несходства.

Изотоническая регрессия также используется в вероятностной классификации для калибровки прогнозируемых вероятностей моделей машинного обучения с учителем. [2]

Изотоническая регрессия для простого упорядоченного случая с одномерным была применена для оценки непрерывных зависимостей доза-реакция в таких областях, как анестезиология и токсикология. Узко говоря, изотоническая регрессия обеспечивает только точечные оценки при наблюдаемых значениях. Оценка полной кривой доза-реакция без каких-либо дополнительных предположений обычно выполняется посредством линейной интерполяции между точечными оценками. [3]

Программное обеспечение для вычисления изотонной (монотонной) регрессии было разработано для R , [4] [5] Stata и Python . [6]

Алгоритмы [ править ]

С точки зрения численного анализа , изотоническая регрессия включает в себя нахождение взвешенного метода наименьших квадратов, подходящего для вектора с вектором весов, подчиняющимся набору непротиворечивых ограничений такого рода . Обычный выбор для ограничений , или, другими словами: каждая точка должна быть не ниже предыдущей.

Такие ограничения определяют частичное или полное упорядочение и могут быть представлены в виде ориентированного графа , где (узлы) - это набор переменных (наблюдаемых значений), участвующих, а (ребра) - это набор пар для каждого ограничения . Таким образом, задача изотонической регрессии соответствует следующей квадратичной программе (QP):

В том случае , когда это общее упорядочение , простой итерационный алгоритм для решения этой квадратичной программы называется алгоритмом смежных Нарушителей бассейна . Напротив, Бест и Чакраварти [7] изучили проблему как проблему идентификации активного множества и предложили простой алгоритм. Эти два алгоритма можно рассматривать как двойственные друг другу, и оба имеют вычислительную сложность для уже отсортированных данных. [7]

Просто заказанный случай [ править ]

Чтобы проиллюстрировать сказанное выше, пусть ограничения будут .

Изотоническая оценка минимизирует взвешенное условие типа наименьших квадратов:

где - множество всех кусочно линейных, неубывающих, непрерывных функций, а - известная функция.

Центрированная изотоническая регрессия [ править ]

Как видно на первом рисунке этой статьи, при наличии нарушений монотонности полученная интерполированная кривая будет иметь плоские (постоянные) интервалы. В приложениях "доза-реакция" обычно известно, что он не только монотонный, но и плавный. Плоские интервалы несовместимы с предполагаемой формой России и могут показаться смещенными. Простое усовершенствование для таких приложений, названное центрированной изотонической регрессией (CIR), было разработано Ороном и Флорной, и было показано, что оно существенно снижает ошибку оценки как для приложений доза-реакция, так и для приложений определения дозы. [8] И CIR, и стандартная изотоническая регрессия для одномерного, просто упорядоченного случая реализованы в пакете R «cir». [4] Этот пакет также предоставляет аналитические оценки доверительного интервала.

Ссылки [ править ]

  1. ^ Крускала, JB (1964). «Неметрическое многомерное масштабирование: численный метод». Психометрика . 29 (2): 115–129. DOI : 10.1007 / BF02289694 .
  2. ^ «Прогнозирование хороших вероятностей с обучением с учителем | Труды 22-й международной конференции по машинному обучению» . dl.acm.org . Проверено 7 июля 2020 .
  3. ^ Stylianou, МП; Флурной, Н. (2002). «Определение дозы с использованием конструкции смещенной вверх-вниз монеты и изотонической регрессии». Биометрия . 58 : 171–177. DOI : 10.1111 / j.0006-341x.2002.00171.x .
  4. ^ а б Орон, Ассаф. «Пакет 'cir ' » . КРАН . R Фонд статистических вычислений . Проверено 26 декабря 2020 года .
  5. ^ Леу, Ян де; Хорник, Курт; Мэр, Патрик (2009). «Оптимизация изотонов в R: Алгоритм соседних с пулом нарушителей (PAVA) и методы активного набора» . Журнал статистического программного обеспечения . 32 (5): 1–24. DOI : 10,18637 / jss.v032.i05 . ISSN 1548-7660 . 
  6. ^ Педрегоса, Фабиан; и другие. (2011). «Scikit-learn: машинное обучение на Python». Журнал исследований в области машинного обучения . 12 : 2825–2830. arXiv : 1201.0490 . Bibcode : 2012arXiv1201.0490P .
  7. ^ a b Бест, Майкл Дж .; Чакраварти, Нилотпал (1990). «Алгоритмы активного набора для изотонической регрессии; объединяющая основа» . Математическое программирование . 47 (1–3): 425–439. DOI : 10.1007 / bf01580873 . ISSN 0025-5610 . 
  8. ^ Орон, AP; Флурной, Н. (2017). "Центрированная изотоническая регрессия: точечная и интервальная оценка исследований" доза-реакция ". Статистика в биофармацевтических исследованиях . 9 : 258–267. arXiv : 1701.05964 . DOI : 10.1080 / 19466315.2017.1286256 .

Дальнейшее чтение [ править ]

  • Робертсон, Т .; Райт, FT; Дикстра, Р.Л. (1988). Заказ ограниченного статистического вывода . Нью-Йорк: Вили. ISBN 978-0-471-91787-8.
  • Барлоу, RE; Варфоломей, диджей; Бремнер, JM; Brunk, HD (1972). Статистический вывод при ограничениях заказа; теория и применение изотонической регрессии . Нью-Йорк: Вили. ISBN 978-0-471-04970-8.
  • Шивели, Т.С., Сагер, Т.В., Уокер, С.Г. (2009). «Байесовский подход к непараметрическому оцениванию монотонных функций». Журнал Королевского статистического общества, Series B . 71 (1): 159–175. CiteSeerX  10.1.1.338.3846 . DOI : 10.1111 / j.1467-9868.2008.00677.x .CS1 maint: multiple names: authors list (link)
  • Wu, WB ; Woodroofe, M .; Менц, Г. (2001). «Изотоническая регрессия: еще один взгляд на проблему точки смены». Биометрика . 88 (3): 793–804. DOI : 10.1093 / Biomet / 88.3.793 .