Статистика , как и все математические дисциплины, не вывести обоснованные выводы из ничего. Чтобы сделать интересные выводы о реальных статистических совокупностях, почти всегда требуются некоторые исходные предположения. Эти предположения необходимо делать осторожно, потому что неверные предположения могут привести к совершенно неточным выводам.
Вот несколько примеров статистических допущений.
- Независимость наблюдений друг от друга (это предположение - особенно частая ошибка [1] ).
- Независимость ошибки наблюдения от потенциальных мешающих эффектов.
- Точная или приблизительная нормальность наблюдений (или ошибок).
- Линейность градуированных ответов на количественные стимулы, например, в линейной регрессии .
Классы предположений
Есть два подхода к статистическому выводу : модели на основе логического вывода и вывод дизайна на основе . [2] [3] [4] Оба подхода полагаются на некоторую статистическую модель для представления процесса генерации данных. В подходе, основанном на моделях, модель считается изначально неизвестной, и одна из целей состоит в том, чтобы выбрать подходящую модель для вывода. В подходе, основанном на разработке, модель считается известной, и одна из целей состоит в том, чтобы гарантировать, что выборочные данные выбираются достаточно случайным образом для вывода.
Статистические допущения можно разделить на два класса, в зависимости от того, какой подход к выводу используется.
- Допущения, основанные на моделях. К ним относятся следующие три типа:
- Предположения о распределении. Если в статистической модели используются термины, относящиеся к случайным ошибкам , могут быть сделаны предположения о распределении вероятностей этих ошибок. [5] В некоторых случаях предположение о распределении относится к самим наблюдениям.
- Структурные допущения. Статистические отношения между переменными часто моделируются путем приравнивания одной переменной к функции другой (или нескольких других) плюс случайная ошибка . Модели часто включают структурные предположения о форме функциональных отношений, например, как в линейной регрессии . Это можно обобщить на модели, включающие отношения между скрытыми ненаблюдаемыми переменными .
- Допущения о перекрестных вариациях. Эти допущения включают совместные распределения вероятностей либо самих наблюдений, либо случайных ошибок в модели. Простые модели могут включать предположение, что наблюдения или ошибки статистически независимы .
- Допущения, основанные на дизайне. Они относятся к способу сбора наблюдений и часто предполагают рандомизацию во время выборки . [6] [7]
Подход, основанный на моделях, чаще всего используется при статистических выводах; подход, основанный на дизайне, используется в основном при выборке обследования . При подходе, основанном на модели, все допущения эффективно кодируются в модели.
Проверка предположений
Учитывая, что достоверность любого вывода, сделанного на основе статистического вывода, зависит от достоверности сделанных предположений, очевидно, что эти предположения должны быть пересмотрены на каком-то этапе. В некоторых случаях - например, при отсутствии данных - может потребоваться, чтобы исследователи оценили обоснованность предположения. Исследователи могут несколько расширить это, чтобы рассмотреть, какой эффект может произвести отклонение от предположений. Там, где доступны более обширные данные, доступны различные типы процедур для валидации статистической модели , например, для валидации регрессионной модели .
Смотрите также
Заметки
- ^ Крускала, 1988
- ↑ Koch GG, Gillings DB (2006), «Вывод, основанный на дизайне или на основе модели», Энциклопедия статистических наук (редактор - Коц С.), Wiley-Interscience .
- ^ Cox, 2006, Ch.9
- ^ Де Gruijterдр., 2006, §2.2
- ^ McPherson, 1990, §3.4.1
- ^ McPherson, 1990, §3.3
- ^ Де Gruijterдр., 2006, §2.2.1
Рекомендации
- Cox DR (2006), Принципы статистического вывода , Cambridge University Press .
- de Gruijter J., Brus D., Bierkens M., Knotters M. (2006), Отбор проб для мониторинга природных ресурсов , Springer-Verlag .
- Краскал, Уильям (декабрь 1988 г.). «Чудеса и статистика: случайное обретение независимости (Послание президента ASA)». Журнал Американской статистической ассоциации . 83 (404): 929–940. DOI : 10.2307 / 2290117 . JSTOR 2290117 .
- Макферсон, Г. (1990), Статистика в научных исследованиях: ее основы, применение и интерпретация , Springer-Verlag . ISBN 0-387-97137-8