Не в теории вероятностей , неравенство Чебышева (также называется неравенство Bienaymé-Чебышева ) гарантирует , что для широкого класса распределений вероятностей , не более определенной доли значений может быть больше , чем на некотором расстоянии от среднего . В частности, не более 1 / k 2 значений распределения могут отличаться от среднего на k или более стандартных отклонений (или, что то же самое, более 1 - 1 / k 2 значений распределения меньше kстандартные отклонения от среднего). В статистике это правило часто называют теоремой Чебышева о диапазоне стандартных отклонений от среднего. Неравенство имеет большую полезность, потому что его можно применить к любому распределению вероятностей, в котором определены среднее значение и дисперсия. Например, его можно использовать для доказательства слабого закона больших чисел .
Его практическое использование аналогично правилу 68–95–99,7 , которое применяется только к нормальным распределениям . Неравенство Чебышева является более общим, утверждая, что минимум 75% значений должны находиться в пределах двух стандартных отклонений от среднего и 88,89% в пределах трех стандартных отклонений для широкого диапазона различных распределений вероятностей . [1] [2]
Термин неравенство Чебышева может также относиться к неравенству Маркова , особенно в контексте анализа. Они тесно связаны, и некоторые авторы называют неравенство Маркова «первым неравенством Чебышева», а подобное неравенство на этой странице - «вторым неравенством Чебышева».
История
Теорема названа в честь русского математика Пафнутия Чебышева , хотя впервые ее сформулировал его друг и коллега Ирене-Жюль Бьенайме . [3] : 98 Теорема была впервые сформулирована без доказательства Бьенайме в 1853 году [4], а затем доказана Чебышевым в 1867 году. [5] Его ученик Андрей Марков представил другое доказательство в своей докторской диссертации 1884 года. Тезис. [6]
Заявление
Неравенство Чебышева обычно формулируется для случайных величин , но может быть обобщено до утверждения о пространствах мер .
Вероятностное утверждение
Пусть X (интегрируемая) - случайная величина с конечным математическим ожиданием μ и конечной ненулевой дисперсией σ 2 . Тогда для любого действительного числа к > 0 ,
Только случай является полезным. Когда правая часть и неравенство тривиально, так как все вероятности ≤ 1.
В качестве примера, используя показывает, что вероятность того, что значения лежат вне интервала не превышает .
Поскольку его можно применять к полностью произвольным распределениям при условии, что они имеют известное конечное среднее значение и дисперсию, неравенство обычно дает плохую оценку по сравнению с тем, что можно было бы вывести, если бы о рассматриваемом распределении известно больше аспектов.
k | Мин. % в пределах k стандартных отклонений от среднего | Максимум. % за k стандартных отклонений от среднего |
---|---|---|
1 | 0% | 100% |
√ 2 | 50% | 50% |
1.5 | 55,56% | 44,44% |
2 | 75% | 25% |
2 √ 2 | 87,5% | 12,5% |
3 | 88,8889% | 11,1111% |
4 | 93,75% | 6,25% |
5 | 96% | 4% |
6 | 97,2222% | 2,7778% |
7 | 97,9592% | 2,0408% |
8 | 98,4375% | 1,5625% |
9 | 98,7654% | 1,2346% |
10 | 99% | 1% |
Утверждение теории меры
Пусть ( X , Σ, μ) является мерой пространства , и пусть е быть расширенной реальной -значная измеримой функции , определенная на X . Тогда для любого действительного числа t > 0 и 0 < p <∞ [7]
В более общем смысле, если g - расширенная измеримая функция с действительными значениями, неотрицательная и неубывающая, сзатем: [ необходима ссылка ]
Затем следует предыдущее утверждение, определяя в виде если а также иначе.
Пример
Предположим, мы случайным образом выбираем журнальную статью из источника, содержащего в среднем 1000 слов на статью, со стандартным отклонением 200 слов. Затем мы можем сделать вывод, что вероятность того, что в нем содержится от 600 до 1400 слов (т. Е. В пределах k = 2 стандартных отклонения от среднего), должна быть не менее 75%, потому что не более 1 ⁄ k2
знак равно 1/4шанс оказаться за пределами этого диапазона по неравенству Чебышева. Но если мы дополнительно знаем, что распределение является нормальным , мы можем сказать, что существует вероятность 75%, что количество слов находится между 770 и 1230 (что является еще более жесткой границей).
Резкость границ
Как показано в приведенном выше примере, теорема обычно дает довольно слабые оценки. Однако эти оценки, как правило, не могут быть улучшены (оставаясь верными для произвольных распределений). Оценки точны для следующего примера: для любого k ≥ 1
Для этого распределения среднее значение μ = 0 и стандартное отклонение σ = 1/k , так
Неравенство Чебышева является равенством как раз для тех распределений, которые являются линейным преобразованием этого примера.
Доказательство (двусторонней версии)
Вероятностное доказательство
Неравенство Маркова утверждает, что для любой вещественной случайной величины Y и любого положительного числа a имеем Pr (| Y |> a ) ≤ E (| Y |) / a . Один из способов доказать неравенство Чебышева - применить неравенство Маркова к случайной величине Y = ( X - μ ) 2 с a = ( kσ ) 2 .
Это также можно доказать напрямую, используя условное ожидание :
Тогда неравенство Чебышева следует делением на k 2 σ 2 .
Это доказательство также показывает, почему оценки в типичных случаях являются довольно слабыми: условное ожидание для события, где | X - μ | < kσ отбрасывается, и нижняя граница k 2 σ 2 для события | X - μ | ≥ kσ может быть довольно плохим.
Теоретико-мерное доказательство
Исправить и разреши быть определенным как , и разреши быть индикаторной функцией множества . Тогда легко проверить, что для любого,
так как g не убывает, и, следовательно,
где последнее неравенство оправдано неотрицательностью g . Требуемое неравенство следует из деления указанного неравенства на g ( t ).
Доказательство в предположении, что случайная величина X непрерывна
Используя определение функции плотности вероятности f ( x ) и стандартную характеристику дисперсии Var ( X ):
у нас есть:
Заменяя kσ на ε , где k = ε / σ , мы получаем неравенство Чебышева в другой форме:
или эквивалент
где ε определяется так же, как k ; любое положительное действительное число.
Расширения
Разработано несколько расширений неравенства Чебышева.
Асимметричный двусторонний
Если X имеет среднее μ и дисперсию σ 2 , то
если а также , где а также . [9]
Это сводится к неравенству Чебышева в симметричном случае ( л и у на равном расстоянии от средней).
Двумерное обобщение
Пусть X 1 , X 2 - две случайные величины со средними μ 1 , μ 2 и конечными дисперсиями σ 1 , σ 2 соответственно. Тогда оценка объединения показывает, что
Эта граница не требует, чтобы X 1 и X 2 были независимыми. [9]
Двумерная известная корреляция
Берже вывел неравенство для двух коррелированных переменных X 1 , X 2 . [10] Пусть ρ - коэффициент корреляции между X 1 и X 2, а σ i 2 - дисперсия X i . потом
Позднее Лал получил альтернативную оценку [11]
Исии сделал еще одно обобщение. [12] Пусть
и определите:
Сейчас есть три случая.
- Случай А: Если а также тогда
- Случай B: Если условия случая A не выполняются, но k 1 k 2 ≥ 1 и
- тогда
- Случай C: Если ни одно из условий в случаях A или B не выполняется, то нет универсальной границы, кроме 1.
Многомерный
Общий случай известен как неравенство Бирнбаума – Раймонда – Цукермана в честь авторов, доказавших его для двух измерений. [13]
где X i - i -я случайная величина, μ i - i-е среднее значение, а σ i 2 - i-я дисперсия.
Если переменные независимы, это неравенство можно усилить. [14]
Олкин и Пратт вывели неравенство для n коррелированных переменных. [15]
где сумма берется по n переменным и
где ρ ij - корреляция между X i и X j .
Неравенство Олкина и Пратта было впоследствии обобщено Годвином. [16]
Конечномерный вектор
Ферентинос [9] показал, что для вектора X = ( x 1 , x 2 , ...) со средним μ = ( μ 1 , μ 2 , ...) стандартное отклонение σ = ( σ 1 , σ 2 , ...) и евклидовой нормы || ⋅ || что
Второе связанное неравенство также было выведено Ченом. [17] Пусть п вполне размерность стохастического вектора X , и пусть Е ( Х ) является средством X . Пусть S - ковариационная матрица и k > 0 . потом
где Y Т является транспонированной из Y . Простое доказательство было получено в Наварро [18] следующим образом:
где
а также симметричная обратимая матрица такая, что: . Следовательно а также где представляет собой единичную матрицу размерности n . потом а также
Наконец, применяя неравенство Маркова к Z, получаем
Итак, желаемое неравенство выполнено.
Неравенство можно записать в терминах расстояния Махаланобиса как
где расстояние Махаланобиса, основанное на S, определяется как
Наварро [19] доказал, что эти границы точны, то есть они являются наилучшими возможными границами для этих регионов, когда мы просто знаем среднее значение и ковариационную матрицу X.
Stellato et al. [20] показали, что этот многомерный вариант неравенства Чебышева может быть легко выведен аналитически как частный случай Vandenberghe et al. [21], где оценка вычисляется путем решения полуопределенной программы (SDP).
Бесконечные измерения
Существует прямое расширение векторной версии неравенства Чебышева на бесконечномерные параметры. Пусть X - случайная величина, которая принимает значения в пространстве Фреше. (снабжены полунормами || ⋅ || α ). Сюда входят наиболее общие настройки векторных случайных величин, например, когдаявляется банаховым пространством (снабженным единственной нормой), гильбертовым пространством или конечномерным пространством, как описано выше.
Предположим, что X имеет " сильный порядок два ", что означает, что
для каждой полунормы || ⋅ || α . Это обобщение требования конечной дисперсии X , необходимое для этой сильной формы неравенства Чебышева в бесконечных измерениях. Термин «сильный порядок два» принадлежит Вахании . [22]
Позволять - интеграл Петтиса от X (т. е. векторное обобщение среднего), и пусть
- стандартное отклонение относительно полунормы || ⋅ || α . В этой настройке мы можем заявить следующее:
- Общая версия неравенства Чебышева.
Доказательство. Доказательство прямое и по сути такое же, как и окончательная версия. Если σ α = 0 , то X почти наверняка константа (и равна μ ), поэтому неравенство тривиально.
Если
тогда || X - μ || α > 0 , поэтому можно смело делить на || X - μ || α . Решающий трюк в неравенстве Чебышева состоит в том, чтобы признать, что.
Следующие вычисления завершают доказательство:
Высшие моменты
Также возможно расширение на высшие моменты:
Экспоненциальный момент
Связанное с этим неравенство, которое иногда называют экспоненциальным неравенством Чебышева [23], является неравенством
Пусть K ( t ) - кумулянтная производящая функция ,
Взяв преобразование Лежандра – Фенхеля [ необходимо пояснение ] для K ( t ) и используя экспоненциальное неравенство Чебышева, мы имеем
Это неравенство можно использовать для получения экспоненциальных неравенств для неограниченных переменных. [24]
Ограниченные переменные
Если P ( x ) имеет конечный носитель, основанный на интервале [ a , b ] , пусть M = max (| a |, | b |), где | х | это абсолютное значение по х . Если среднее значение P ( x ) равно нулю, то для всех k > 0 [25]
Второе из этих неравенств при r = 2 - оценка Чебышева. Первый обеспечивает нижнюю границу значения P ( x ).
Точные оценки для ограниченной вариации были предложены Ниемитало, но без доказательства [26]
Пусть 0 ≤ X ≤ M, где M > 0 . потом
- Дело 1:
- Случай 2:
- Случай 3:
Конечные образцы
Одномерный случай
Со и соавторы распространили неравенство Чебышева на случаи, когда среднее значение и дисперсия генеральной совокупности неизвестны и могут не существовать, но выборочное среднее и стандартное отклонение выборки от N выборок должны использоваться, чтобы ограничить ожидаемое значение нового рисунка из того же распределения. . [27]
где X - случайная величина, из которой мы производили выборку N раз, m - среднее значение выборки, k - постоянная величина, а s - стандартное отклонение выборки. g ( x ) определяется следующим образом:
Пусть x ≥ 1, Q = N + 1 и R - наибольшее целое число, меньшее Q / x . Позволять
Сейчас
Это неравенство сохраняется даже тогда, когда моментов популяции не существует и когда выборка лишь слабо обменно распределена; этот критерий выполняется для рандомизированной выборки. Таблица значений неравенства Со-Янга-Мо для конечных размеров выборки ( N <100) была составлена Konijn. [28] Таблица позволяет рассчитывать различные доверительные интервалы для среднего, основанного на кратных C, стандартной ошибки среднего, рассчитанного по выборке. Например, Konijn показывает, что для N = 59 95-процентный доверительный интервал для среднего m равен ( m - Cs , m + Cs ), где C = 4,447 × 1,006 = 4,47 (это в 2,28 раза больше, чем значение, найденное на предположение о нормальности, показывающее потерю точности в результате незнания точного характера распределения).
Кабан дает несколько менее сложную версию этого неравенства. [29]
Если стандартное отклонение кратно среднему, то можно вывести дополнительное неравенство, [29]
Таблица значений неравенства Со-Янга-Мо для конечных размеров выборки ( N <100) была составлена Konijn. [28]
При фиксированном N и большом m неравенство Сау – Янга – Мо приблизительно равно [30]
Бисли и др. Предложили модификацию этого неравенства [30]
При эмпирическом тестировании эта модификация консервативна, но, по-видимому, имеет низкую статистическую мощность. Его теоретическая основа в настоящее время остается неизученной.
Зависимость от размера выборки
Границы, которые эти неравенства дают для конечной выборки, менее жесткие, чем оценки, которые неравенство Чебышева дает для распределения. Чтобы проиллюстрировать это, пусть размер выборки N = 100 и пусть k = 3. Неравенство Чебышева утверждает, что самое большее приблизительно 11,11% распределения будет лежать как минимум на три стандартных отклонения от среднего. Версия неравенства Кабана для конечной выборки гласит, что самое большее приблизительно 12,05% выборки лежит за этими пределами. Зависимость доверительных интервалов от размера выборки дополнительно проиллюстрирована ниже.
Для N = 10 95% доверительный интервал составляет приблизительно ± 13,5789 стандартных отклонений.
Для N = 100 95% доверительный интервал составляет приблизительно ± 4,9595 стандартных отклонений; доверительный интервал 99% составляет приблизительно ± 140,0 стандартных отклонений.
Для N = 500 95% доверительный интервал составляет приблизительно ± 4,5574 стандартного отклонения; 99% доверительный интервал составляет приблизительно ± 11,1620 стандартных отклонений.
Для N = 1000 доверительные интервалы 95% и 99% составляют приблизительно ± 4,5141 и приблизительно ± 10,5330 стандартных отклонений соответственно.
Неравенство Чебышева для распределения дает 95% и 99% доверительные интервалы приблизительно ± 4,472 стандартных отклонений и ± 10 стандартных отклонений соответственно.
Неравенство Самуэльсона
Хотя неравенство Чебышева является наилучшей возможной оценкой для произвольного распределения, это не обязательно верно для конечных выборок. Неравенство Самуэльсона утверждает, что все значения выборки будут лежать в пределах √ N - 1 стандартного отклонения от среднего. Оценка Чебышева улучшается с увеличением размера выборки.
Когда N = 10, неравенство Самуэльсона утверждает, что все члены выборки находятся в пределах 3 стандартных отклонений от среднего: в отличие от Чебышева, 99,5% выборки находятся в пределах 13,5789 стандартных отклонений от среднего.
Когда N = 100, неравенство Самуэльсона утверждает, что все члены выборки находятся в пределах приблизительно 9,9499 стандартных отклонений от среднего: Чебышев утверждает, что 99% выборки находятся в пределах 10 стандартных отклонений от среднего.
Когда N = 500, неравенство Самуэльсона утверждает, что все члены выборки находятся в пределах примерно 22,3383 стандартных отклонений от среднего: Чебышев утверждает, что 99% выборки находятся в пределах 10 стандартных отклонений от среднего.
Многомерный случай
Stellato et al. [20] упростили обозначения и расширили эмпирическое неравенство Чебышева из Saw et al. [27] к многомерному случаю. Позволять случайная величина и пусть . Мы рисуем iid образцы обозначается как . На основе первого образцов, мы определяем эмпирическое среднее как и несмещенная эмпирическая ковариация как . Если невырожден, то для всех тогда
Замечания
В одномерном случае, т.е. , это неравенство соответствует неравенству из Saw et al. [27] Более того, правая часть может быть упрощена, если ограничить нижнюю функцию сверху ее аргументом
В виде , правая часть стремится к что соответствует многомерному неравенству Чебышева над эллипсоидами, имеющими форму и сосредоточен в .
Заостренные границы
Неравенство Чебышева важно из-за его применимости к любому распределению. В результате своей универсальности он не может (и обычно не дает) такой четкой границы, как альтернативные методы, которые можно использовать, если известно распределение случайной величины. Для улучшения точности оценок неравенства Чебышева был разработан ряд методов; для обзора см. например. [31]
Стандартизированные переменные
Более точные границы могут быть получены путем предварительной стандартизации случайной величины. [32]
Пусть X - случайная величина с конечной дисперсией Var ( X ). Пусть Z - стандартизованная форма, определяемая как
Лемма Кантелли тогда
Это неравенство является точным и достигается значениями k и −1 / k с вероятностью 1 / (1 + k 2 ) и k 2 / (1 + k 2 ) соответственно.
Если k > 1 и распределение X симметрично, то имеем
Равенство выполняется тогда и только тогда, когда Z = - k , 0 или k с вероятностями 1/2 k 2 , 1 - 1 / k 2 и 1/2 k 2 соответственно. [32] Также возможно расширение до двустороннего неравенства.
Пусть u , v > 0. Тогда имеем [32]
Полуварианты
Альтернативный способ получения более резкие границы через использование semivariances (частичные) дисперсий. Верхняя ( σ + 2 ) и нижняя ( σ - 2 ) вариации определяются как
где m - среднее арифметическое для выборки, а n - количество элементов в выборке.
Дисперсия выборки - это сумма двух вариаций:
В терминах нижней полувариантности неравенство Чебышева можно записать [33]
Положив
Неравенство Чебышева теперь можно записать
Аналогичный результат можно получить и для верхней полувариантности.
Если мы положим
Неравенство Чебышева можно записать
Поскольку σ u 2 ≤ σ 2 , использование полудисперсности усиливает исходное неравенство.
Если известно, что распределение симметрично, то
а также
Этот результат согласуется с результатом, полученным с использованием стандартизованных переменных.
- Примечание
- Неравенство с более низкой полувариантностью оказалось полезным при оценке риска ухудшения ситуации в финансах и сельском хозяйстве. [33] [34] [35]
Неравенство Сельберга
Сельберг вывел неравенство для P ( x ), когда a ≤ x ≤ b . [36] Для упрощения обозначений пусть
где
а также
В результате этого линейного преобразования P ( a ≤ X ≤ b ) становится равным P (| Y | ≤ k ).
Среднее ( μ X ) и дисперсия ( σ X ) X связаны со средним ( μ Y ) и дисперсией ( σ Y ) Y :
В этих обозначениях неравенство Сельберга утверждает, что
Это, как известно, наилучшие возможные границы. [37]
Неравенство Кантелли
Неравенство Кантелли [38], созданное Франческо Паоло Кантелли, утверждает, что для реальной случайной величины ( X ) со средним значением ( μ ) и дисперсией ( σ 2 )
где a ≥ 0.
Это неравенство можно использовать для доказательства одностороннего варианта неравенства Чебышева с k > 0 [39]
Граница для однохвостого варианта, как известно, резкая. Чтобы увидеть это, рассмотрим случайную величину X, которая принимает значения
- с вероятностью
- с вероятностью
Тогда E ( X ) = 0, E ( X 2 ) = σ 2 и P ( X <1) = 1 / (1 + σ 2 ).
Приложение - расстояние между средним и медианным значением
Односторонний вариант может использоваться для доказательства утверждения о том, что для распределений вероятностей, имеющих ожидаемое значение и медиану , среднее и медианное никогда не могут отличаться друг от друга более чем на одно стандартное отклонение . Чтобы выразить это в символах, пусть μ , ν и σ будут соответственно средним, медианным и стандартным отклонением. потом
Нет необходимости предполагать, что дисперсия конечна, потому что это неравенство тривиально верно, если дисперсия бесконечна.
Доказательство таково. Принятие k = 1 в формулировке одностороннего неравенства дает:
Меняя знак X и μ , получаем
Медианной по определению является любое действительное число m , удовлетворяющее неравенствам
это означает, что медиана находится в пределах одного стандартного отклонения от среднего. Доказательство , используя неравенство Йенсена также существует .
Неравенство Бхаттачарьи
Бхаттачарья [40] расширил неравенство Кантелли, используя третий и четвертый моменты распределения.
Пусть μ = 0 и σ 2 дисперсия. Пусть γ = E ( X 3 ) / σ 3 и κ = E ( X 4 ) / σ 4 .
Если k 2 - k γ - 1> 0, то
Необходимость k 2 - k γ - 1> 0 требует, чтобы k было достаточно большим.
Неравенство Митценмахера и Упфала
Митценмахер и Упфаль [41] отмечают, что
для любого целого k > 0 и что
является 2 к й центральному моменту. Затем они показывают, что при t > 0
При k = 1 получаем неравенство Чебышева. При t ≥ 1, k > 2 и в предположении, что k- й момент существует, эта оценка более жесткая, чем неравенство Чебышева.
Связанные неравенства
Известны и другие связанные с этим неравенства.
Неравенство Зелена
Зелен показал, что [42]
с участием
где M m - m -й момент [ требуется пояснение ], а σ - стандартное отклонение.
Неравенство Хэ, Чжана и Чжана
Для любого набора из n неотрицательных независимых случайных величин X i с математическим ожиданием 1 [43]
Лемма Хёффдинга
Пусть X - случайная величина с a ≤ X ≤ b и E [ X ] = 0 , тогда для любого s > 0 имеем
Связь Ван Зуйлена
Пусть X i - набор независимых случайных величин Радемахера : Pr ( X i = 1) = Pr ( X i = −1) = 0,5 . Тогда [44]
Оценка точна и лучше, чем та, которая может быть получена из нормального распределения (приблизительно Pr> 0,31 ).
Унимодальные распределения
Функция распределения F является унимодальной в ν, если ее кумулятивная функция распределения является выпуклой на (−∞, ν ) и вогнутой на ( ν , ∞) [45] Эмпирическое распределение можно проверить на унимодальность с помощью теста наклона . [46]
В 1823 г. Гаусс показал, что для одномодального распределения с нулевой модой [47]
Если мода не равна нулю, а среднее ( μ ) и стандартное отклонение ( σ ) конечны, то, обозначая медиану как ν и среднеквадратичное отклонение от моды через ω , мы имеем [ необходима цитата ]
а также
Винклер в 1866 г. распространил неравенство Гаусса на r -ые моменты [48], где r > 0 и распределение является унимодальным с нулевой модой:
Граница Гаусса была впоследствии уточнена и распространена на отклонения от среднего, а не на моду, обусловленную неравенством Высочанского – Петунина . Последний был расширен Дхармадхикари и Джоаг-Девом [49]
где s - постоянная, удовлетворяющая как s > r + 1, так и s ( s - r - 1) = r r и r > 0.
Можно показать, что эти неравенства являются наилучшими из возможных и что дальнейшее уточнение границ требует наложения дополнительных ограничений на распределения.
Унимодальные симметричные распределения
Границы этого неравенства также можно уточнить, если распределение является одновременно унимодальным и симметричным . [50] Эмпирическое распределение можно проверить на симметрию с помощью ряда тестов, включая R * Мак-Вильямса. [51] Известно , что дисперсия одномодального симметричного распределения с конечным носителем [ , Ь ] меньше или равно ( б - в ) 2 / 12. [52]
Пусть распределение поддерживается на конечном интервале [- N , N ] и дисперсия конечна. Пусть режим распределения равен нулю, и измените масштаб дисперсии до 1. Пусть k > 0 и предположим, что k <2 N / 3. Тогда [50]
Если 0 < k ≤ 2 / √ 3, границы достигаются с плотностью [50]
Если 2 / √ 3 < k ≤ 2 N / 3, оценки достигаются распределением
где β k = 4/3 k 2 , δ 0 - дельта-функция Дирака и где
Существование этих плотностей показывает, что оценки оптимальны. Поскольку N произвольно эти границы применимы к любому значению N .
Неравенство Кэмп-Мейделла является родственным неравенством. [53] Для абсолютно непрерывного унимодального и симметричного распределения
DasGupta показала, что если известно нормальное распределение [54]
Заметки
Эффекты симметрии и унимодальности
Симметрия распределения уменьшает границы неравенства в 2 раза, в то время как унимодальность уточняет границы в 4/9 раз. [ необходима цитата ]
Поскольку среднее значение и мода в унимодальном распределении отличаются не более чем на √ 3 стандартных отклонения [55], не более 5% симметричного унимодального распределения находятся вне (2 √ 10 + 3 √ 3 ) / 3 стандартных отклонений среднего (приблизительно 3,840 стандартных отклонений). Это более точно, чем оценки, обеспечиваемые неравенством Чебышева (приблизительно 4,472 стандартных отклонения).
Эти границы для среднего менее точны, чем те, которые могут быть получены только на основе симметрии распределения, которая показывает, что максимум 5% распределения находится за пределами приблизительно 3,162 стандартных отклонений среднего. Неравенство Vysochanskiï-Петуния дополнительно обостряет эту оценку, показав , что для такого распределения в том , что не более 5% от распределения лежит за пределами 4 √ 5 /3 (примерно 2,981) стандартных отклонений от среднего значения.
Симметричные унимодальные распределения
Для любого симметричного унимодального распределения [ необходима ссылка ]
- максимум приблизительно 5,784% распределения лежит за пределами 1,96 стандартных отклонений режима
- не более 5% от распределения лежит за пределами 2 √ 10 /3 (приблизительно 2.11) стандартных отклонений от режима
Нормальные распределения
Неравенство DasGupta утверждает, что для нормального распределения не менее 95% находится в пределах примерно 2,582 стандартных отклонений от среднего. Это менее резкое, чем истинное значение (приблизительно 1,96 стандартного отклонения среднего).
Границы для конкретных дистрибутивов
- DasGupta определила набор наилучших возможных оценок нормального распределения для этого неравенства. [54]
- Стелига и Шиналь распространили эти границы на распределение Парето . [8]
- Гречук и др. разработал общий метод получения наилучших возможных оценок в неравенстве Чебышева для любого семейства распределений и любой меры риска отклонения вместо стандартного отклонения. В частности, они вывели неравенство Чебышева для распределений с логарифмически вогнутыми плотностями. [56]
Ноль означает
Когда среднее ( μ ) равно нулю, неравенство Чебышева принимает простой вид. Пусть σ 2 - дисперсия. потом
При тех же условиях неравенство Кантелли принимает вид
Отклонение от единицы
Если при этом E ( X 2 ) = 1 и E ( X 4 ) = ψ, то для любого 0 ≤ ε ≤ 1 [57]
Первое неравенство точное. Это известно как неравенство Пэли – Зигмунда .
Также известно, что для случайной величины, удовлетворяющей указанным выше условиям, [58]
где
Также известно, что [58]
Значение C 0 оптимально и оценки точны, если
Если
тогда точная оценка
Интегральное неравенство Чебышева
Существует второе (менее известное) неравенство, также названное именем Чебышева [59]
Если f , g : [ a , b ] → R - две монотонные функции одной монотонности, то
Если f и g имеют противоположную монотонность, то указанное выше неравенство работает в обратном порядке.
Это неравенство связанно с неравенством Дженсены , [60] неравенство Канторович , [61] неравенство Эрмита-Адамар [61] и гипотеза Уолтера . [62]
Другое неравенство
Есть также ряд других неравенств, связанных с Чебышевым:
- Неравенство сумм Чебышева
- Неравенства Чебышева – Маркова – Стилтьеса.
Превращение холдейна
Одно из применений неравенства Чебышева в приложениях - создание доверительных интервалов для переменных с неизвестным распределением. Холдейн отметил [63], используя уравнение, полученное Кендаллом , [64], что если переменная ( x ) имеет нулевое среднее значение, единичную дисперсию, а также конечную асимметрию ( γ ) и эксцесс ( κ ), тогда вариация может быть преобразована в стандартная оценка с нормальным распределением ( z ):
Это преобразование может быть полезно как альтернатива неравенству Чебышева или как дополнение к нему для получения доверительных интервалов для переменных с неизвестными распределениями.
Хотя это преобразование может быть полезно для умеренно искаженных и / или куртотических распределений, оно плохо работает, когда распределение заметно искажено и / или куртотическое.
Заметки
Агентство по охране окружающей среды предложило лучшие практики использования неравенства Чебышева для оценки доверительных интервалов. <Исх> Расчет верхних доверительных пределов воздействия точечных скоплений на опасных сайтах отходов (Отчет). Управление по чрезвычайным ситуациям и восстановлению Агентства по охране окружающей среды США. Декабрь 2002 . Дата обращения 5 августа 2016 .
Смотрите также
- Многомерное неравенство Чебышева.
- Неравенство концентрации - сводка хвостовых границ случайных величин.
- Расширение Корниш – Фишера
- Неравенство Итона
- Неравенство Колмогорова
- Доказательство слабого закона больших чисел с помощью неравенства Чебышева
- Теорема Ле Кама
- Неравенство Пэли – Зигмунда.
- Неравенство Высочанского – Петунина - более сильный результат, применимый к унимодальным вероятностным распределениям
Рекомендации
- ^ Кванли, Алан Х .; Павур, Роберт Дж .; Килинг, Келли Б. (2006). Краткая управленческая статистика . cEngage Learning . С. 81–82. ISBN 9780324223880.
- ^ Черник, Майкл Р. (2011). Основы биостатистики для врачей, медсестер и клиницистов . Джон Вили и сыновья . С. 49–50. ISBN 9780470641859.
- ^ Кнут, Дональд (1997). Искусство программирования: фундаментальные алгоритмы, том 1 (3-е изд.). Ридинг, Массачусетс: Аддисон – Уэсли. ISBN 978-0-201-89683-1. Проверено 1 октября 2012 года .
- ^ Bienaymé, I.-J. (1853 г.). "Considérations àl'appui de la découverte de Laplace". Comptes Rendus de l'Académie des Sciences . 37 : 309–324.
- ^ Чебичеф, П. (1867). "Des valeurs moyennes". Journal de Mathématiques Pures et Appliquées . 2. 12 : 177–184.
- ^ Марков А. (1884) О некоторых приложениях алгебраических цепных дробей, Ph.D. кандидатская, Санкт-Петербург
- ^ Графакос, Лукас (2004). Классический и современный анализ Фурье . Pearson Education Inc. стр. 5.
- ^ а б Стелига, Катажина; Шинал, Доминик (2010). «О неравенствах марковского типа» (PDF) . Международный журнал чистой и прикладной математики . 58 (2): 137–152. ISSN 1311-8080 . Проверено 10 октября 2012 года .
- ^ а б в Ферентинос, К. (1982). «О неравенствах типа Чебыча». Trabajos Estadıst Investigacion Oper . 33 : 125–132. DOI : 10.1007 / BF02888707 . S2CID 123762564 .
- ^ Берге, П.О. (1938). «Заметка о форме теоремы Чебычева для двух переменных». Биометрика . 29 (3/4): 405–406. DOI : 10.2307 / 2332015 . JSTOR 2332015 .
- ^ Лал Д. Н. (1955) Замечание о форме неравенства Чебышева для двух или более переменных. Санкхья 15 (3): 317–320
- ^ Исии К. (1959) Об одном методе обобщений неравенства Чебычева. Ann Inst Stat Math 10: 65–88
- ^ Бирнбаум, ZW; Raymond, J .; Цукерман, HS (1947). «Обобщение неравенства Чебышева на два измерения» . Летопись математической статистики . 18 (1): 70–79. DOI : 10.1214 / АОМ / 1177730493 . ISSN 0003-4851 . MR 0019849 . Zbl 0032.03402 . Проверено 7 октября 2012 года .
- ^ Коц, Самуэль ; Балакришнан, Н .; Джонсон, Норман Л. (2000). Непрерывные многомерные распределения, Том 1, Модели и приложения (2-е изд.). Бостон [ua]: Хоутон Миффлин. ISBN 978-0-471-18387-7. Проверено 7 октября 2012 года .
- ^ Олкин, Инграм ; Пратт, Джон В. (1958). «Многомерное неравенство Чебычева» . Летопись математической статистики . 29 (1): 226–234. DOI : 10.1214 / АОМ / 1177706720 . Руководство по ремонту 0093865 . Zbl 0085.35204 .
- ^ Годвин HJ (1964) Неравенства по функциям распределения. Нью-Йорк, Hafner Pub. Co.
- ^ Синьцзя Чен (2007). «Новое обобщение неравенства Чебышева для случайных векторов». arXiv : 0707.0805v2 [ math.ST ].
- ^ а б Стеллато, Бартоломео; Пэрис, Барт П.Г. Ван; Гуларт, Пол Дж. (31 мая 2016 г.). «Многомерное неравенство Чебышева с оценкой среднего и дисперсии». Американский статистик . 71 (2): 123–127. arXiv : 1509.08398 . DOI : 10.1080 / 00031305.2016.1186559 . ISSN 0003-1305 . S2CID 53407286 .
- ^ Vandenberghe, L .; Boyd, S .; Команор, К. (01.01.2007). «Обобщенные границы Чебышева с помощью полуопределенного программирования». SIAM Обзор . 49 (1): 52–64. Bibcode : 2007SIAMR..49 ... 52V . CiteSeerX 10.1.1.126.9105 . DOI : 10.1137 / S0036144504440543 . ISSN 0036-1445 .
- ^ Вахания Николай Николаевич. Распределения вероятностей на линейных пространствах. Нью-Йорк: Северная Голландия, 1981.
- ↑ Раздел 2.1. Архивировано 30 апреля 2015 г., в Wayback Machine.
- ^ Бараноски, Гладимир В.Г .; Rokne, Jon G .; Сюй, Гуанву (15 мая 2001 г.). «Применение экспоненциального неравенства Чебышева к недетерминированному вычислению формфакторов». Журнал количественной спектроскопии и переноса излучения . 69 (4): 199–200. Bibcode : 2001JQSRT..69..447B . DOI : 10.1016 / S0022-4073 (00) 00095-9 . (ссылки на эту статью исправлены Бараноски, Гладимир В.Г .; Rokne, Jon G .; Гуанву Сюй (15 января 2002 г.). «Исправление к:« Применение экспоненциального неравенства Чебышева к недетерминированному вычислению формфакторов » ». Журнал количественной спектроскопии и переноса излучения . 72 (2): 199–200. Bibcode : 2002JQSRT..72..199B . DOI : 10.1016 / S0022-4073 (01) 00171-6 .)
- ^ Dufour (2003) Свойства моментов случайных величин
- ^ Ниемитало О. (2012) Односторонние неравенства типа Чебышева для ограниченных вероятностных распределений.
- ^ а б в Пила, Джон Дж .; Ян, Марк СК; Мо, Цзэ Чин (1984). «Неравенство Чебышева с оценкой среднего и дисперсии». Американский статистик . 38 (2): 130–2. DOI : 10.2307 / 2683249 . ISSN 0003-1305 . JSTOR 2683249 .
- ^ а б Конейн, Хендрик С. (февраль 1987 г.). «Без распространения и другие интервалы прогнозирования». Американский статистик . 41 (1): 11–15. DOI : 10.2307 / 2684311 . JSTOR 2684311 .
- ^ а б Кабан, Ата (2012). «Непараметрическое обнаружение бессмысленных расстояний в данных большой размерности». Статистика и вычисления . 22 (2): 375–85. DOI : 10.1007 / s11222-011-9229-0 . S2CID 6018114 .
- ^ а б Бисли, Т. Марк; Page, Grier P .; Бренд, Jaap PL; Gadbury, Gary L .; Mountz, John D .; Эллисон, Дэвид Б. (январь 2004 г.). «Неравенство Чебышева для непараметрического тестирования с малыми N и α в исследовании микрочипов». Журнал Королевского статистического общества . C (Прикладная статистика). 53 (1): 95–108. DOI : 10.1111 / j.1467-9876.2004.00428.x . ISSN 1467-9876 .
- ^ Сэвидж, И. Ричард. «Вероятностные неравенства типа Чебычева». Журнал исследований Национального бюро стандартов-B. Математика и математическая физика B 65 (1961): 211-222
- ^ а б в Ион, Роксана Алиса (2001). «Глава 4: Точные неравенства типа Чебышева» . Непараметрический статистический контроль процессов . Universiteit van Amsterdam. ISBN 978-9057760761. Проверено 1 октября 2012 года .
- ^ а б Берк, Питер ; Хин, Иаир М. (май 1982 г.). «Использование полувариантности для оценки правил безопасности прежде всего». Американский журнал экономики сельского хозяйства . 64 (2): 298–300. DOI : 10.2307 / 1241139 . ISSN 0002-9092 . JSTOR 1241139 .
- ^ Нантелл, Тимоти Дж .; Прайс, Барбара (июнь 1979 г.). "Аналитическое сравнение теории рынка капитала дисперсии и полувариантности". Журнал финансового и количественного анализа . 14 (2): 221–42. DOI : 10.2307 / 2330500 . JSTOR 2330500 .
- ^ Нив, Эдвин Х .; Росс, Майкл Н .; Ян, июнь (2009). «Отличить потенциал роста от риска снижения». Новости управленческих исследований . 32 (1): 26–36. DOI : 10.1108 / 01409170910922005 . ISSN 0140-9174 .
- ^ Сельберг, Хенрик Л. (1940). «Zwei Ungleichungen zur Ergänzung des Tchebycheffschen Lemmas» [Два неравенства, дополняющие лемму Чебышева]. Skandinavisk Aktuarietidskrift (Скандинавский актуарный журнал) (на немецком языке). 1940 (3–4): 121–125. DOI : 10.1080 / 03461238.1940.10404804 . ISSN 0346-1238 . OCLC 610399869 .
- ^ Conlon, J .; Дула, Дж. Х. "Геометрический вывод и интерпретация неравенства Чебышева" (PDF) . Проверено 2 октября 2012 года . Цитировать журнал требует
|journal=
( помощь ) - ^ Кантелли Ф. (1910) Intorno ad un teorema fondamentale della teoria del rischio. Bolletino dell Associazione degli Attuari Italiani
- ^ Гриммет и Стирзакер, проблема 7.11.9. Несколько доказательств этого результата можно найти в неравенствах Чебышева А.Г. Макдауэлла.
- ^ Бхаттачарья, BB (1987). «Одностороннее неравенство Чебышева, когда известны первые четыре момента». Коммуникации в статистике - теория и методы . 16 (9): 2789–91. DOI : 10.1080 / 03610928708829540 . ISSN 0361-0926 .
- ^ Митценмахер, Майкл ; Упфал, Эли (январь 2005 г.). Вероятность и вычисления: рандомизированные алгоритмы и вероятностный анализ (Repr. Ed.). Кембридж [ua]: Cambridge Univ. Нажмите. ISBN 9780521835404. Проверено 6 октября 2012 года .
- ^ Зелен М. (1954) Границы функции распределения, которые являются функциями моментов до четвертого порядка. J Res Nat Bur Stand 53: 377–381
- ^ Он, С .; Zhang, J .; Чжан, С. (2010). «Граничная вероятность малого отклонения: подход четвертого момента». Математика исследования операций . 35 (1): 208–232. DOI : 10.1287 / moor.1090.0438 . S2CID 11298475 .
- ^ Мартиен CA ван Зуйлен (2011) О гипотезе о сумме независимых случайных величин Радемахера
- ^ Феллер, Уильям (1966). Введение в теорию вероятностей и ее приложения, Том 2 (2-е изд.). Вайли. п. 155. ISBN 9789994311071. Проверено 6 октября 2012 года .
- ^ Hartigan, JA; Хартиган, PM (1985). «Dip-тест унимодальности» . Летопись статистики . 13 : 70–84. DOI : 10.1214 / AOS / 1176346577 . Руководство по ремонту 0773153 .
- ^ Gauss CF Theoria Combinationis Observationum Erroribus Minimis Obnoxiae. Парс Приора. Pars Posterior. Дополнение. Теория наименее подверженной ошибкам комбинации наблюдений. Первая часть. Часть вторая. Добавка. 1995. Перевод GW Stewart. Classics in Applied Mathematics Series, Общество промышленной и прикладной математики, Филадельфия
- ^ Винклер А. (1886) Математическая теория естествознания Kl. Акад. Wiss Wien Zweite Abt 53, 6–41
- ^ Дхармадхикари, Юго-Западный; Йоаг-Дев, К. (1985). «Неравенство Гаусса – Чебышева для унимодальных распределений» (PDF) . Теория вероятностей и ее применения . 30 (4): 817–820.
- ^ а б в Кларксон, Эрик; Денни, JL; Шепп, Ларри (2009). «ROC и оценки хвостовых вероятностей с помощью теорем Дубинса и Ф. Рисса» . Летопись прикладной теории вероятностей . 19 (1): 467–76. arXiv : 0903.0518 . Bibcode : 2009arXiv0903.0518C . DOI : 10.1214 / 08-AAP536 . PMC 2828638 . PMID 20191100 .
- ^ Маквильямс, Томас П. (1990). «Тест без распределения для симметрии на основе статистики прогонов». Журнал Американской статистической ассоциации . 85 (412): 1130–3. DOI : 10.2307 / 2289611 . ISSN 0162-1459 . JSTOR 2289611 .
- ^ Seaman, John W., Jr; Янг, Дин М .; Оделл, Патрик Л. (1987). «Улучшение оценок дисперсии малой выборки для ограниченных случайных величин». Промышленная математика . 37 : 65–75. ISSN 0019-8528 . Zbl 0637.62024 .
- ^ Бикель, Питер Дж .; Кригер, Абба М. (1992). «Расширения неравенства Чебышева с приложениями» (PDF) . Вероятность и математическая статистика . 13 (2): 293–310. ISSN 0208-4147 . Проверено 6 октября 2012 года .
- ^ а б ДасГупта, А (2000). «Наилучшие константы в неравенствах Чебычева с различными приложениями». Метрика . 5 (1): 185–200. DOI : 10.1007 / s184-000-8316-9 . S2CID 121436601 .
- ^ «Еще мысли об односторонней версии неравенства Чебышева - Генри Боттомли» . se16.info . Проверено 12 июня 2012 .[ постоянная мертвая ссылка ]
- ^ Гречук, Б., Molyboha А., Zabarankin, M. (2010). Неравенства Чебышева с инвариантными по закону мерами отклонения , вероятность в технике и информатике, 24 (1), 145-170.
- ^ Годвин HJ (1964) Неравенства по функциям распределения. (Глава 3) Нью-Йорк, Хафнер Паб. Co.
- ^ a b Лесли Ф. Д., Ротарь В. И. (2003) Некоторые замечания о нижних оценках типа Чебышева для полупрямой. J Inequalities Pure Appl Math 4 (5) Статья 96
- ^ Финк, AM; Jodeit, Макс, младший (1984). «О другом неравенстве Чебышева» . In Tong, YL; Гупта, Шанти С. (ред.). Неравенства в статистике и вероятности . Конспект лекций Института математической статистики - Серия монографий. 5 . С. 115–120. DOI : 10.1214 / lnms / 1215465637 . ISBN 978-0-940600-04-1. Руководство по ремонту 0789242 . Проверено 7 октября 2012 года .
- ^ Никулеску, Константин П. (2001). «Расширение неравенства Чебышева и его связь с неравенством Йенсена» . Журнал неравенств и приложений . 6 (4): 451–462. CiteSeerX 10.1.1.612.7056 . DOI : 10.1155 / S1025583401000273 . ISSN 1025-5834 . Проверено 6 октября 2012 года .
- ^ а б Никулеску, Константин П .; Печарич, Йосип (2010). «Эквивалентность неравенства Чебышева неравенству Эрмита – Адамара» (PDF) . Математические отчеты . 12 (62): 145–156. ISSN 1582-3067 . Проверено 6 октября 2012 года .
- ^ Маламуд, С.М. (15 февраля 2001 г.). «Некоторые дополнения к неравенствам Йенсена и Чебышева и проблема У. Вальтера» . Труды Американского математического общества . 129 (9): 2671–2678. DOI : 10.1090 / S0002-9939-01-05849-X . ISSN 0002-9939 . Руководство по ремонту 1838791 . Проверено 7 октября 2012 года .
- ^ Холдейн, Дж. Б. (1952). «Простые тесты на бимодальность и битангентность». Летопись евгеники . 16 (4): 359–364. DOI : 10.1111 / j.1469-1809.1951.tb02488.x . PMID 14953132 .
- Перейти ↑ Kendall MG (1943) The Advanced Theory of Statistics, 1. London
дальнейшее чтение
- А. Папулис (1991), Вероятность, случайные величины и случайные процессы , 3-е изд. Макгроу – Хилл. ISBN 0-07-100870-5 . С. 113–114.
- Г. Гриммет и Д. Стирзакер (2001), Вероятность и случайные процессы , 3-е изд. Оксфорд. ISBN 0-19-857222-0 . Раздел 7.3.
Внешние ссылки
- "Неравенство Чебышева в теории вероятностей" , Математическая энциклопедия , EMS Press , 2001 [1994]
- Формальное доказательство в системе Мицара .