Непараметрическая статистика


Непараметрическая статистика — это раздел статистики , который не основан исключительно на параметризованных семействах вероятностных распределений (распространенными примерами параметров являются среднее значение и дисперсия). Непараметрическая статистика основана либо на отсутствии распределения, либо на наличии определенного распределения, но с неуказанными параметрами распределения. Непараметрическая статистика включает как описательную статистику , так и статистический вывод . Непараметрические тесты часто используются, когда допущения параметрических тестов нарушаются. [1]

Термин «непараметрическая статистика» был неточно определен, среди прочего, двумя способами.

Статистические гипотезы касаются поведения наблюдаемых случайных величин... Например, гипотеза (а) о том, что нормальное распределение имеет заданное среднее значение, а дисперсия является статистической; так же обстоит дело и с гипотезой (б) о том, что она имеет заданное среднее значение, но не указанную дисперсию; то же самое можно сказать и о гипотезе (с) о том, что распределение имеет нормальную форму с неопределенными средним значением и дисперсией; наконец, то же самое можно сказать и о гипотезе (d) о том, что два неопределенных непрерывных распределения идентичны.

Следует заметить, что в примерах (а) и (б) распределение, лежащее в основе наблюдений, принималось как имеющее определенную форму (нормальное), и гипотеза полностью касалась значения одного или обоих ее параметров. Такая гипотеза по понятным причинам называется параметрической .

Гипотеза (в) носила иной характер, так как в формулировке гипотезы не указаны значения параметров; мы могли бы разумно назвать такую ​​гипотезу непараметрической . Гипотеза (d) также непараметрична, но, кроме того, она даже не определяет лежащую в основе форму распределения и теперь может быть обоснованно названа свободной от распределения . Несмотря на эти различия, статистическая литература теперь обычно применяет ярлык «непараметрический» к процедурам тестирования, которые мы только что назвали «свободными от распределения», тем самым теряя полезную классификацию.

Непараметрические методы широко используются для изучения популяций в ранжированном порядке (например, обзоры фильмов, получившие от одной до четырех звезд). Использование непараметрических методов может быть необходимо, когда данные ранжированы , но не имеют четкой числовой интерпретации, например, при оценке предпочтений . С точки зрения уровней измерения непараметрические методы приводят к порядковым данным .