Параметрическая статистика


Параметрическая статистика — это раздел статистики, который предполагает, что выборочные данные поступают из совокупности, которая может быть адекватно смоделирована с помощью распределения вероятностей с фиксированным набором параметров . [1] И наоборот, непараметрическая модель не предполагает явной (конечно-параметрической) математической формы распределения при моделировании данных. Однако он может делать некоторые предположения об этом распределении, такие как непрерывность или симметрия.

Наиболее известные статистические методы являются параметрическими. [2] Что касается непараметрических (и полупараметрических) моделей, сэр Дэвид Кокс сказал: «Они обычно включают меньше предположений о структуре и форме распределения, но обычно содержат сильные предположения о независимости». [3]

Все нормальное семейство распределений имеет одинаковую общую форму и параметризовано средним значением и стандартным отклонением . Это означает, что если известны среднее значение и стандартное отклонение и если распределение является нормальным, известна вероятность любого будущего наблюдения, лежащего в заданном диапазоне.

Предположим, что у нас есть выборка из 99 результатов тестов со средним значением 100 и стандартным отклонением 1. Если мы предположим, что все 99 результатов тестов являются случайными наблюдениями из нормального распределения, то мы предсказываем, что существует 1% вероятность того, что 100-й тест результат будет выше, чем 102,33 (то есть среднее значение плюс 2,33 стандартного отклонения), при условии, что 100-й результат теста получен из того же распределения, что и другие. Параметрические статистические методы используются для вычисления приведенного выше значения 2,33 с учетом 99 независимых наблюдений из одного и того же нормального распределения.

Непараметрическая оценка того же самого — максимум из первых 99 баллов. Нам не нужно делать каких-либо предположений о распределении тестовых баллов, чтобы понять, что до того, как мы дали тест, была равная вероятность того, что самый высокий балл будет любой из первых 100. Таким образом, существует 1%-ная вероятность того, что 100-й балл будет первым. выше, чем любой из 99 предшествующих ему.

Параметрическая статистика была упомянута Р. А. Фишером в его работе «Статистические методы для научных работников » 1925 г., создавшей основу современной статистики.