Тест Андерсона – Дарлинга

Тест Андерсона – Дарлинга - это статистический тест , определяющий, получена ли данная выборка данных из заданного распределения вероятностей . В своей основной форме тест предполагает, что в тестируемом распределении нет параметров, которые необходимо оценить, и в этом случае тест и его набор критических значений не распространяются. Однако этот тест чаще всего используется в контекстах, где тестируется семейство распределений, и в этом случае необходимо оценить параметры этого семейства, и это необходимо принять во внимание при корректировке либо тестовой статистики, либо ее критических значений. Применительно к проверке наличия нормального распределенияадекватно описывает набор данных, это один из самых мощных статистических инструментов для обнаружения большинства отклонений от нормы . ^[1]^[2]K- выборочные тесты Андерсона – Дарлинга доступны для проверки того, можно ли моделировать несколько наборов наблюдений как исходящие от одной популяции, где не требуется указывать функцию распределения .

В дополнение к его использованию в качестве теста соответствия для распределений, его можно использовать при оценке параметров в качестве основы для формы процедуры оценки минимального расстояния .

Тест назван в честь Теодора Уилбура Андерсона (1918–2016) и Дональда А. Дарлинга (1915–2014), которые изобрели его в 1952 году ^[3]

Одновыборочный тест

Статистика Андерсона – Дарлинга и Крамера – фон Мизеса относится к классу квадратичных статистик EDF (тестов, основанных на эмпирической функции распределения ). ^[2] Если предполагаемое распределение ${\ displaystyle F}$ , а эмпирическая (выборочная) кумулятивная функция распределения имеет вид ${\ displaystyle F_ {n}}$ , то квадратичная статистика EDF измеряет расстояние между ${\ displaystyle F}$ а также ${\ displaystyle F_ {n}}$ от

{\ Displaystyle п \ int _ {- \ infty} ^ {\ infty} (F_ {n} (x) -F (x)) ^ {2} \, w (x) \, dF (x),}

где ${\ displaystyle n}$ - количество элементов в выборке, а ${\ Displaystyle ш (х)}$ - весовая функция. Когда весовая функция ${\ Displaystyle ш (х) = 1}$ , статистика - это статистика Крамера – фон Мизеса . Тест Андерсона – Дарлинга (1954) ^[4] основан на расстоянии

{\ displaystyle A ^ {2} = n \ int _ {- \ infty} ^ {\ infty} {\ frac {(F_ {n} (x) -F (x)) ^ {2}} {F (x ) \; (1-F (x))}} \, dF (x),}

которое получается, когда весовая функция ${\ Displaystyle ш (х) = [F (х) \; (1-F (х))] ^ {- 1}}$ . Таким образом, по сравнению с расстоянием Крамера – фон Мизеса расстояние Андерсона – Дарлинга придает больший вес наблюдениям в хвостах распределения.

Базовая статистика теста

Тест Андерсона – Дарлинга определяет, происходит ли выборка из указанного распределения. Он использует тот факт, что, когда задано гипотетическое базовое распределение и предполагается, что данные действительно возникают из этого распределения, можно предположить , что кумулятивная функция распределения (CDF) данных подчиняется равномерному распределению . Затем данные могут быть проверены на однородность с помощью теста расстояния (Shapiro 1980). Формула для тестовой статистики ${\ displaystyle A}$ оценить, есть ли данные ${\ Displaystyle \ {Y_ {1} <\ cdots$ (обратите внимание, что данные должны быть упорядочены) поступает из CDF ${\ displaystyle F}$ является

{\ Displaystyle А ^ {2} = - nS \ ,,}

где

{\ displaystyle S = \ sum _ {i = 1} ^ {n} {\ frac {2i-1} {n}} \ left [\ ln (F (Y_ {i})) + \ ln \ left (1 -F (Y_ {n + 1-i}) \ right) \ right].}

Затем статистику теста можно сравнить с критическими значениями теоретического распределения. Обратите внимание, что в этом случае никакие параметры не оцениваются по отношению к кумулятивной функции распределения. ${\ displaystyle F}$ .

Тесты для семейств дистрибутивов

По сути, та же самая тестовая статистика может использоваться в тесте соответствия семейства распределений, но затем ее необходимо сравнивать с критическими значениями, соответствующими этому семейству теоретических распределений и также зависящими от метода, используемого для оценки параметров.

Тест на нормальность

Эмпирическое тестирование показало ^[5], что тест Андерсона – Дарлинга не так хорош, как тест Шапиро – Уилка , но лучше других тестов. Стивенс ^[1] найден ${\ displaystyle A ^ {2}}$ быть одной из лучших статистических данных эмпирической функции распределения для обнаружения большинства отклонений от нормальности.

Расчет различается в зависимости от того, что известно о распределении: ^[6]

Случай 0: Среднее ${\ displaystyle \ mu}$ и дисперсия ${\ displaystyle \ sigma ^ {2}}$ оба известны.
Случай 1: Дисперсия ${\ displaystyle \ sigma ^ {2}}$ известно, но среднее ${\ displaystyle \ mu}$ неизвестно.
Случай 2: среднее ${\ displaystyle \ mu}$ известно, но дисперсия ${\ displaystyle \ sigma ^ {2}}$ неизвестно.
Случай 3: оба средних ${\ displaystyle \ mu}$ и дисперсия ${\ displaystyle \ sigma ^ {2}}$ неизвестны.

В п наблюдений, ${\ displaystyle X_ {i}}$ , для ${\ Displaystyle я = 1, \ ldots п}$ , переменной ${\ displaystyle X}$ должны быть отсортированы так, чтобы ${\ Displaystyle X_ {1} \ leq X_ {2} \ leq ... \ leq X_ {n}}$ и в следующих обозначениях предполагается, что X _i представляет упорядоченные наблюдения. Позволять

{\ displaystyle {\ hat {\ mu}} = {\ begin {cases} \ mu, & {\ text {, если известно среднее значение.}} \\ {\ bar {X}}, = {\ frac {1 } {n}} \ sum _ {i = 1} ^ {n} X_ {i} & {\ text {в противном случае.}} \ end {case}}}

{\ displaystyle {\ hat {\ sigma}} ^ {2} = {\ begin {cases} \ sigma ^ {2}, & {\ text {, если дисперсия известна.}} \\ {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} (X_ {i} - \ mu) ^ {2}, & {\ text {если дисперсия неизвестна, но известно среднее значение.}} \ \ {\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (X_ {i} - {\ bar {X}}) ^ {2}, & {\ text {иначе .}} \ end {case}}}

Ценности ${\ displaystyle X_ {i}}$ стандартизированы для создания новых ценностей ${\ displaystyle Y_ {i}}$ , данный

{\ displaystyle Y_ {i} = {\ frac {X_ {i} - {\ hat {\ mu}}} {\ hat {\ sigma}}}.}.

Со стандартным нормальным CDF ${\ displaystyle \ Phi}$ , ${\ displaystyle A ^ {2}}$ рассчитывается с использованием

{\ displaystyle A ^ {2} = - n - {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} (2i-1) (\ ln \ Phi (Y_ {i}) + \ ln (1- \ Phi (Y_ {n + 1-i}))).}

Альтернативное выражение, в котором на каждом этапе суммирования рассматривается только одно наблюдение:

{\ displaystyle A ^ {2} = - n - {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ left [(2i-1) \ ln \ Phi (Y_ {i }) + (2 (ni) +1) \ ln (1- \ Phi (Y_ {i})) \ right].}

Модифицированную статистику можно рассчитать с помощью

{\ displaystyle A ^ {* 2} = {\ begin {cases} A ^ {2} \ left (1 + {\ frac {4} {n}} - {\ frac {25} {n ^ {2}}) } \ right), & {\ text {если и дисперсия, и среднее значение неизвестны.}} \\ A ^ {2}, & {\ text {в противном случае.}} \ end {cases}}}

Если ${\ displaystyle A ^ {2}}$ или же ${\ displaystyle A ^ {* 2}}$ превышает заданное критическое значение, то гипотеза о нормальности отклоняется с некоторым уровнем значимости. Критические значения приведены в таблице ниже для значений ${\ displaystyle A ^ {2}}$ . ^[1]^[7]

Примечание 1: если ${\ displaystyle {\ hat {\ sigma}}}$ = 0 или любое ${\ displaystyle \ Phi (Y_ {i}) =}$ (0 или 1), тогда ${\ displaystyle A ^ {2}}$ не может быть вычислен и не определен.

Примечание 2: Приведенная выше формула корректировки взята из Shorack & Wellner (1986, стр. 239). При сравнении различных источников требуется осторожность, поскольку часто конкретная формула корректировки не указывается.

Примечание 3: Стивенс ^[1] отмечает, что тест становится лучше, когда параметры вычисляются на основе данных, даже если они известны.

Примечание 4: Marsaglia и Marsaglia ^[7] предоставляют более точный результат для случая 0 при 85% и 99%.

Дело	п	15%	10%	5%	2,5%	1%
0	${\ displaystyle \ geq 5}$	1,621	1,933	2,492	3,070	3,878
1			0,908	1,105	1,304	1,573
2	${\ displaystyle \ geq 5}$		1,760	2.323	2,904	3,690
3	10	0,514	0,578	0,683	0,779	0,926
	20	0,528	0,591	0,704	0,815	0,969
	50	0,546	0,616	0,735	0,861	1.021
	100	0,559	0,631	0,754	0,884	1.047
	${\ displaystyle \ infty}$	0,576	0,656	0,787	0,918	1.092

В качестве альтернативы, для случая 3 выше (как среднее значение, так и дисперсия неизвестны), Д'Агостино (1986) ^[6] в таблице 4.7 на стр. 123 и на страницах 372–373 приведены скорректированные статистические данные:

{\ displaystyle A ^ {* 2} = A ^ {2} \ left (1 + {\ frac {0.75} {n}} + {\ frac {2.25} {n ^ {2}}} \ right).}

и нормальность отвергается, если ${\ displaystyle A ^ {* 2}}$ превышает 0,631, 0,752, 0,873, 1,035 или 1,159 при уровнях значимости 10%, 5%, 2,5%, 1% и 0,5% соответственно; процедура действительна для размера выборки не менее n = 8. Формулы для вычисления р -значения для других значений ${\ displaystyle A ^ {* 2}}$ приведены в таблице 4.9 на стр. 127 в той же книге.

Тесты для других дистрибутивов

Выше предполагалось, что переменная ${\ displaystyle X_ {i}}$ тестировался на нормальное распределение. Можно протестировать любое другое семейство распределений, но тест для каждого семейства реализуется с использованием различных модификаций базовой статистики теста, и это относится к критическим значениям, специфичным для этого семейства распределений. Модификации статистики и таблиц критических значений даны Стивенсом (1986) ^[2] для экспоненциального, экстремального, распределения Вейбулла, гамма-распределения, логистического распределения, распределения Коши и фон Мизеса. Тесты на логарифмически нормальное распределение (двухпараметрическое) могут быть реализованы путем преобразования данных с использованием логарифма и использования вышеуказанного теста на нормальность. Подробная информация о необходимых модификациях статистики теста и критических значениях нормального и экспоненциального распределения была опубликована Pearson & Hartley (1972, таблица 54). Подробности этих распределений с добавлением распределения Гамбеля также даны Shorack & Wellner (1986, стр. 239). Детали логистического распределения даны Стивенсом (1979). Тест для (двухпараметрического) распределения Вейбулла можно получить, используя тот факт, что логарифм переменной Вейбулла имеет распределение Гумбеля .

Непараметрические k- выборочные тесты

Фриц Шольц и Майкл А. Стивенс (1987) обсуждают критерий, основанный на мере согласия Андерсона-Дарлинга между распределениями, для определения того, могло ли число случайных выборок с возможно разными размерами выборок возникнуть из одного и того же распределения, где это распределение равно неопределенные. ^[8] Пакет R kSamples реализует этот ранговый тест для сравнения k выборок среди нескольких других таких ранговых тестов. ^[9]

Смотрите также

дальнейшее чтение

Кордер, GW, Форман, Д.И. (2009). Непараметрическая статистика для нестатистиков: пошаговый подход Wiley, ISBN 978-0-470-45461-9
Мехта, С. (2014) Темы статистикиISBN 978-1499273533
Пирсон ES, Хартли, HO (редакторы) (1972) Таблицы биометрики для статистиков , Том II. ЧАШКА. ISBN 0-521-06937-8 .
Шапиро, SS (1980) Как проверить нормальность и другие предположения о распределении. В: Основные ссылки ASQC в области контроля качества: статистические методы 3, стр. 1–78.
Шорак, Г. Р., Веллнер, Дж. А. (1986) Эмпирические процессы с приложениями к статистике , Wiley. ISBN 0-471-86725-X .
Стивенс, М.А. (1979) Проверка соответствия логистическому распределению на основе эмпирической функции распределения , Биометрика, 66 (3), 591–5.

Внешние ссылки

Справочник по статистике NIST США

[Stephens74-1] а б в г Стивенс, Массачусетс (1974). «Статистика соответствия EDF и некоторые сравнения». Журнал Американской статистической ассоциации . 69 : 730–737. DOI : 10.2307 / 2286009 .

[Stephens86-2] а б в М.А. Стивенс (1986). «Тесты на основе статистики EDF». В Д'Агостино, РБ; Стивенс, Массачусетс (ред.). Методы согласия . Нью-Йорк: Марсель Деккер. ISBN 0-8247-7487-6.

[3] Андерсон, TW ; Дарлинг, Д.А. (1952). «Асимптотическая теория некоторых критериев согласия, основанная на случайных процессах» . Анналы математической статистики . 23 : 193–212. DOI : 10.1214 / АОМ / 1177729437 .

[AD54-4] Андерсон, TW; Дарлинг, Д.А. (1954). «Тест на пригодность». Журнал Американской статистической ассоциации . 49 : 765–769. DOI : 10.2307 / 2281537 .

[5] Разали, Норнадия; Вау, Яп Би (2011). «Силовые сравнения тестов Шапиро – Вилка, Колмогорова – Смирнова, Лиллиэфорса и Андерсона – Дарлинга» (PDF) . Журнал статистического моделирования и аналитики . 2 (1): 21–33. Архивировано из оригинального (PDF) 30 июня 2015 года . Проверено 5 июня 2012 года .

[RBD86-6] а б Ральф Б. Д'Агостино (1986). «Тесты на нормальное распределение». В Д'Агостино, РБ; Стивенс, Массачусетс (ред.). Методы согласия . Нью-Йорк: Марсель Деккер. ISBN 0-8247-7487-6.

[Marsaglia04-7] а б Марсалья, Г. (2004). «Оценка распределения Андерсона-Дарлинга». Журнал статистического программного обеспечения . 9 (2): 730–737.

[8] Scholz, FW; Стивенс, Массачусетс (1987). «Тесты Андерсона – Дарлинга K-выборки». Журнал Американской статистической ассоциации . 82 (399): 918–924. DOI : 10.1080 / 01621459.1987.10478517 .

[9] «kSamples: K-выборочные ранговые тесты и их комбинации» . R проект .

[1]