Из Википедии, бесплатной энциклопедии
  (Перенаправлен из проверки регрессионной модели )
Перейти к навигации Перейти к поиску

В статистике , проверка регрессии представляет собой процесс принятия решения о численных результаты количественно гипотетические отношения между переменным, полученными из регрессионного анализа , являются приемлемыми в качестве описания данных. Процесс проверки может включать в себя анализ степени соответствия регрессии, анализ того, являются ли остатки регрессии случайными, и проверку того, существенно ли ухудшаются прогностические характеристики модели при применении к данным, которые не использовались при оценке модели.

Качество соответствия [ править ]

Одним из критериев качества соответствия является R 2 ( коэффициент детерминации ), который в обычных методах наименьших квадратов с точкой пересечения находится в диапазоне от 0 до 1. Однако R 2, близкий к 1, не гарантирует, что модель хорошо соответствует данным: поскольку Квартет Анскомба показывает, что высокий R 2 может иметь место при неправильном указании функциональной формы отношений или при наличии выбросов, которые искажают истинные отношения.

Одна из проблем с R 2 в качестве меры достоверности модели заключается в том, что его всегда можно увеличить, добавив больше переменных в модель, за исключением маловероятного случая, когда дополнительные переменные точно не коррелируют с зависимой переменной в используемой выборке данных. Этой проблемы можно избежать, выполнив F-тест статистической значимости увеличения R 2 или вместо этого используя скорректированный R 2 .

Анализ остатков [ править ]

В остатки из подобранной модели различия между ответами , наблюдаемых при каждой комбинации значений независимых переменных и соответствующего предсказания ответа , вычисленной с использованием функции регрессии. Математически определение остатка для i- го наблюдения в наборе данных записывается

где y i обозначает i- й ответ в наборе данных, а x i - вектор независимых переменных, каждая из которых имеет соответствующие значения, найденные в i- м наблюдении в наборе данных.

Если бы модель соответствовала данным, то остатки аппроксимировали бы случайные ошибки, которые превращают взаимосвязь между независимыми переменными и переменной ответа в статистическую взаимосвязь. Следовательно, если кажется, что остатки ведут себя случайным образом, это говорит о том, что модель хорошо соответствует данным. С другой стороны, если в остатках очевидна неслучайная структура, это явный признак того, что модель плохо соответствует данным. В следующем разделе подробно описаны типы графиков, которые следует использовать для тестирования различных аспектов модели, и даны правильные интерпретации различных результатов, которые можно было наблюдать для каждого типа графика.

Графический анализ остатков [ править ]

Основной, хотя и не количественно точный, способ проверки проблем, которые делают модель неадекватной, - это провести визуальный анализ остатков (ошибочных прогнозов данных, используемых при количественной оценке модели), чтобы найти очевидные отклонения от случайности. Если визуальный осмотр предполагает, например, возможное присутствие гетероскедастичности (отношения между дисперсией ошибок модели и размером наблюдений независимой переменной), то можно провести статистические тесты, чтобы подтвердить или опровергнуть это предположение; если это подтверждается, требуются другие процедуры моделирования.

Различные типы графиков остатков от подобранной модели предоставляют информацию об адекватности различных аспектов модели.

  1. достаточность функциональной части модели: графики разброса остатков по сравнению с предикторами
  2. непостоянная вариация данных: графики разброса остатков по сравнению с предикторами; для данных, собранных с течением времени, а также графики остатков в зависимости от времени
  3. дрейф ошибок (данные, собираемые с течением времени): запустите графики отклика и ошибок в зависимости от времени
  4. независимость от ошибок: график лага
  5. нормальность ошибок: гистограмма и график нормальной вероятности

Графические методы имеют преимущество перед численными методами проверки модели, поскольку они легко иллюстрируют широкий спектр сложных аспектов взаимосвязи между моделью и данными.

Количественный анализ остатков [ править ]

Численные методы также играют важную роль в валидации модели. Например, тест на отсутствие соответствия для оценки правильности функциональной части модели может помочь в интерпретации графика пограничных остатков. Одна из распространенных ситуаций, когда числовые методы проверки имеют приоритет над графическими методами, - это когда количество оцениваемых параметров относительно близко к размеру набора данных. В этой ситуации графики остатков часто трудно интерпретировать из-за ограничений на остатки, налагаемых оценкой неизвестных параметров. Одна из областей, в которой это обычно происходит, - это приложения для оптимизации с использованием запланированных экспериментов . Логистическая регрессия с двоичными данными - еще одна область, в которой графический остаточный анализ может быть затруднен.

Последовательная корреляция остатков может указывать на неправильную спецификацию модели, и ее можно проверить с помощью статистики Дарбина – Ватсона . Проблема гетероскедастичности может быть решена любым из нескольких способов .

Оценка вне выборки [ править ]

Перекрестная проверка - это процесс оценки того, как результаты статистического анализа будут обобщены на независимый набор данных. Если модель была оценена на основе некоторых, но не всех доступных данных, то модель, использующая оцененные параметры, может быть использована для прогнозирования удерживаемых данных. Если, например, среднеквадратичная ошибка вне выборки , также известная как среднеквадратичная ошибка прогноза , существенно выше, чем среднеквадратичная ошибка внутри выборки, это является признаком недостатка модели.

Развитие медицинской статистики - это использование методов перекрестной проверки вне выборки в метаанализе. Он составляет основу валидационной статистики Vn , которая используется для проверки статистической достоверности сводных оценок метаанализа. По сути, он измеряет тип нормализованной ошибки прогнозирования, а его распределение представляет собой линейную комбинацию χ 2 переменных степени 1. [1]

См. Также [ править ]

  • Все модели неправильные
  • Интервал прогноза
  • Ресэмплинг (статистика)
  • Достоверность статистического заключения
  • Спецификация статистической модели
  • Статистическая проверка модели
  • Срок действия (статистика)
  • Коэффициент детерминации
  • Неподходящая сумма квадратов
  • Уменьшенный хи-квадрат

Ссылки [ править ]

  1. ^ Willis BH, Райли RD (2017). «Измерение статистической достоверности сводных результатов мета-анализа и мета-регрессии для использования в клинической практике» . Статистика в медицине . 36 (21): 3283–3301. DOI : 10.1002 / sim.7372 . PMC  5575530 . PMID  28620945 .

Дальнейшее чтение [ править ]

  • Arboretti Giancristofaro, R .; Салмазо, Л. (2003), «Анализ производительности модели и проверка модели в логистической регрессии» , Statistica , 63 : 375–396.
  • Kmenta, Jan (1986), Elements of Econometrics (Second ed.), Macmillan, pp. 593–600.; переиздано в 1997 году издательством Michigan Press

Внешние ссылки [ править ]

  • Как я могу определить, подходит ли модель моим данным? (NIST)
  • Электронный справочник статистических методов NIST / SEMATECH
  • Модель диагностики ( Эберли, Колледж наук )

 Эта статья включает материалы, являющиеся  общественным достоянием, с веб-сайта Национального института стандартов и технологий https://www.nist.gov .