В статистике и приложениях статистики нормализация может иметь ряд значений. [1] В простейших случаях нормализация рейтингов означает приведение значений, измеренных в разных шкалах, к условно общей шкале, часто до усреднения. В более сложных случаях нормализация может относиться к более сложным корректировкам, когда цель состоит в том, чтобы привести все распределения вероятностей скорректированных значений в соответствие. В случае нормализации оценок в образовательной оценке может быть намерение привести распределения в соответствие с нормальным распределением . Другой подход к нормализации вероятностных распределений:квантильная нормализация , при которой квантили различных мер приводятся в соответствие.
В другом использовании в статистике нормализация относится к созданию смещенных и масштабированных версий статистики, где цель состоит в том, чтобы эти нормализованные значения позволяли сравнивать соответствующие нормализованные значения для разных наборов данных таким образом, чтобы исключить эффекты определенных грубых влияний, как в аномальном временном ряду . Некоторые типы нормализации включают только изменение масштаба, чтобы получить значения относительно некоторой переменной размера. С точки зрения уровней измерения такие соотношения имеют смысл только для измерений отношения (где имеют значение отношения измерений), а не интервальных измерений (где значимы только расстояния, но не отношения).
В теоретической статистике параметрическая нормализация часто может приводить к ключевым величинам - функциям, распределение выборки которых не зависит от параметров - и к вспомогательной статистике - ключевым величинам, которые могут быть вычислены на основе наблюдений, не зная параметров.
Примеры [ править ]
В статистике существуют различные типы нормализации - безразмерные отношения ошибок, остатков, средних и стандартных отклонений , которые, следовательно, инвариантны к масштабу - некоторые из них можно резюмировать следующим образом. Обратите внимание, что с точки зрения уровней измерения эти соотношения имеют смысл только для измерений отношения (где значимы отношения измерений), а не интервальных измерений (где значимы только расстояния, но не отношения). См. Также Категория: Статистические коэффициенты .
Имя | Формула | Использовать |
---|---|---|
Стандартный балл | Нормализация ошибок, когда известны параметры популяции. Хорошо работает для нормально распределенных популяций [2] | |
T-статистика Стьюдента | отклонение оценочного значения параметра от его предполагаемого значения, нормированного на его стандартную ошибку. | |
Студентизированный остаток | Нормализация остатков при оценке параметров, особенно по разным точкам данных в регрессионном анализе . | |
Стандартизированный момент | Нормализация моментов с использованием стандартного отклонения в качестве меры масштаба. | |
Коэффициент вариации | Нормализация дисперсии с использованием среднего в качестве меры масштаба, особенно для положительного распределения, такого как экспоненциальное распределение и распределение Пуассона . | |
Минимальное-максимальное масштабирование функции | Масштабирование функции используется для приведения всех значений в диапазон [0,1]. Это также называется нормализацией на основе единицы. Это можно обобщить, чтобы ограничить диапазон значений в наборе данных между любыми произвольными точками и , например, используя . |
Обратите внимание, что некоторые другие отношения, такие как отношение дисперсии к среднему , также выполняются для нормализации, но не являются безразмерными: единицы не отменяются, и, таким образом, отношение имеет единицы измерения и не является масштабно-инвариантным.
Другие типы [ править ]
Другие безразмерные нормализации, которые можно использовать без предположений о распределении, включают:
- Присвоение процентилей . Это обычное дело для стандартизированных тестов. См. Также квантильную нормализацию .
- Нормализация путем добавления и / или умножения на константы, чтобы значения попадали в диапазон от 0 до 1. Это используется для функций плотности вероятности с приложениями в таких областях, как физическая химия, при назначении вероятностей для | ψ | 2 .