Коэффициент Lexis [1] используется в статистике как мера, которая стремится оценить различия между статистическими свойствами случайных механизмов, где результат является двузначным - например, «успех» или «неудача», «победа» или «поражение». . Идея состоит в том, что вероятность успеха может варьироваться в зависимости от набора испытаний в разных ситуациях. В настоящее время это соотношение мало используется, поскольку его в значительной степени заменяет использование критерия хи-квадрат при проверке однородности образцов.
Этот показатель сравнивает дисперсию между наборами пропорций выборки (оцениваемых для каждого набора) с тем, какой должна быть дисперсия, если бы не было разницы между истинными пропорциями успеха в разных наборах. Таким образом, эта мера используется для оценки того, как данные соотносятся с распределением Бернулли с фиксированной вероятностью успеха . Термин «соотношение Lexis» иногда называют L или Q , где
Где это (взвешенная) дисперсия выборки, полученная из наблюдаемых долей успеха в наборах в «испытаниях Lexis» и- это дисперсия, рассчитанная из ожидаемого распределения Бернулли на основе общей средней доли успеха. Испытания, в которых L падает значительно выше или ниже 1, называются сверхнормальными и субнормальными соответственно.
Это отношение (Q) является мерой, которая может использоваться для различения трех типов вариаций в выборке для атрибутов: бернуллианской, лексической и пуассонской. Соотношение Lexis иногда также называют L .
Определение
Пусть имеется k выборок размера n 1 , n 3 , n 3 , ..., n k, и эти выборки имеют долю проверяемого атрибута p 1 , p 2 , p 3 , ..., p k соответственно. . Тогда коэффициент Лексиса равен
Если коэффициент Лексиса значительно ниже 1, выборка называется пуассоновской (или субнормальной); он равен 1, выборка называется бернуллианской (или нормальной); и если он больше 1, он называется лексианским (или сверхнормальным).
Чупров в 1922 г. показал, что в случае статистической однородности
а также
где E () - математическое ожидание, а var () - дисперсия. Формула дисперсии является приблизительной и верна только для больших значений n .
Альтернативное определение:
здесь это (взвешенная) дисперсия выборки, полученная из наблюдаемых долей успеха в наборах в «испытаниях Lexis» и - это дисперсия, рассчитанная из ожидаемого распределения Бернулли на основе общей средней доли успеха.
Вариация лексики
Тесно родственное понятие - вариация Lexis. Пусть случайным образом отобраны k выборок размера n каждая . Пусть вероятность успеха ( p ) постоянна, и пусть фактическая вероятность успеха в k- й выборке будет p 1 , p 2 , ..., p k .
Средняя вероятность успеха ( p ) равна
Разница в количестве успехов составляет
где var ( p i ) - дисперсия p i .
Если все p i равны, выборка называется бернуллианской; где p i различаются, выборка называется лексической, а дисперсия - сверхнормальной.
Лексическая выборка происходит при выборке из неоднородных слоев.
История
Вильгельм Лексис ввел эту статистику, чтобы проверить распространенное в то время предположение о том, что данные выборки можно рассматривать как однородные.
Рекомендации
- ^ Lexis W (1877) Zur Theorie Der Massenerscheinungen в Der Menschlichen Gesellschaft.