Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , особенно в регрессионном анализе , двоичная регрессия оценивает взаимосвязь между одной или несколькими независимыми переменными и одной выходной двоичной переменной . Обычно моделируется вероятность двух альтернатив вместо простого вывода одного значения, как при линейной регрессии .

Бинарная регрессия обычно анализируется как частный случай биномиальной регрессии с одним исходом ( ) и одной из двух альтернатив, рассматриваемых как «успех» и кодируемой как 1: значение представляет собой количество успехов в 1 испытании, либо 0, либо 1. Наиболее распространенными моделями бинарной регрессии являются логит-модель ( логистическая регрессия ) и пробит-модель ( пробит-регрессия ).

Приложения [ править ]

Двоичная регрессия в основном применяется либо для прогнозирования ( двоичная классификация ), либо для оценки связи между независимыми переменными и выходными данными. В экономике бинарные регрессии используются для моделирования бинарного выбора .

Интерпретации [ править ]

Модели бинарной регрессии можно интерпретировать как модели скрытых переменных вместе с моделью измерения; или как вероятностные модели, непосредственно моделирующие вероятность.

Модель со скрытыми переменными [ править ]

Интерпретация скрытой переменной традиционно использовалась в биотестах , в результате чего была получена пробит-модель , в которой предполагаются нормальная дисперсия и пороговое значение. Интерпретация скрытых переменных также используется в теории ответа на вопросы (IRT).

Формально интерпретация скрытой переменной утверждает, что результат y связан с вектором независимых переменных x соотношением

где и , β - вектор параметров, а G - распределение вероятностей .

Эта модель может применяться во многих экономических контекстах. Например, результатом может быть решение менеджера, вкладывать ли средства в программу, - это ожидаемый чистый дисконтированный денежный поток, а x - вектор переменных, которые могут повлиять на денежный поток этой программы. Тогда менеджер будет инвестировать только тогда, когда ожидает, что чистый дисконтированный денежный поток будет положительным. [1]

Часто предполагается , что член ошибки соответствует нормальному распределению, зависящему от объясняющих переменных x . Это создает стандартную пробит-модель . [2]

Вероятностная модель [ править ]

Простейшей прямой вероятностной моделью является логит-модель , которая моделирует логарифмические шансы как линейную функцию объясняющей переменной или переменных. Логит-модель является «самой простой» в смысле обобщенных линейных моделей (GLIM): логарифмические шансы являются естественным параметром для экспоненциального семейства распределения Бернулли, и, следовательно, ее проще всего использовать для вычислений.

Другая прямая вероятностная модель - это линейная вероятностная модель , которая моделирует саму вероятность как линейную функцию независимых переменных. Недостатком линейной вероятностной модели является то, что для некоторых значений независимых переменных модель будет предсказывать вероятности меньше нуля или больше единицы.

См. Также [ править ]

  • Обобщенная линейная модель § Двоичные данные
  • Дробная модель

Ссылки [ править ]

  1. ^ Подробный пример см .: Тецуо Яй, Сэйдзи Ивакура, Сигэру Моричи, Мультиномиальный пробит со структурированной ковариацией для поведения выбора маршрута, Транспортные исследования, часть B: Методологические, том 31, выпуск 3, июнь 1997, страницы 195–207, ISSN 0191-2615
  2. ^ Блисс, CI (1934). «Метод пробитов». Наука 79 (2037): 38–39.
  • Лонг, Дж. Скотт; Фриз, Джереми (2006). «4. Модели для бинарных исходов: 4.1 Статистическая модель» . Модели регрессии для категориальных зависимых переменных с использованием Stata, второе издание . Stata Press. С. 131–136. ISBN 978-1-59718011-5.CS1 maint: ref = harv ( ссылка )
  • Агрести, Алан (2007). «3.2 Обобщенные линейные модели для двоичных данных». Категориальный анализ данных (2-е изд.). стр.  68 -73.CS1 maint: ref = harv ( ссылка )