Распределение вероятностей


В теории вероятностей и статистике распределение вероятностей — это математическая функция , которая дает вероятности возникновения различных возможных результатов эксперимента . [1] [2] Это математическое описание случайного явления с точки зрения его выборочного пространства и вероятностей событий ( подмножеств выборочного пространства). [3]

Например, если X используется для обозначения результата подбрасывания монеты («эксперимент»), то распределение вероятностей X будет принимать значение 0,5 (1 из 2 или 1/2) для X  = орел и 0,5 для X  = решка (при условии, что монета честная ). Примеры случайных явлений включают погодные условия в какой-то момент в будущем, рост случайно выбранного человека, долю учащихся мужского пола в школе, результаты проводимого опроса и т. д. [4]

Распределение вероятностей — это математическое описание вероятностей событий, подмножеств выборочного пространства . Выборочное пространство, часто обозначаемое как , представляет собой набор всех возможных результатов наблюдаемого случайного явления; это может быть любой набор: набор действительных чисел , набор векторов , набор произвольных нечисловых значений и т. д. Например, пространство выборки подбрасывания монеты будет Ω = {орел, решка} .

Чтобы определить распределения вероятностей для конкретного случая случайных величин (чтобы пространство выборки можно было рассматривать как числовой набор), принято различать дискретные и непрерывные случайные величины . В дискретном случае достаточно указать функцию массы вероятности, приписывающую вероятность каждому возможному исходу: например, при бросании честной кости каждое из шести значений от 1 до 6 имеет вероятность 1/6. Затем вероятность события определяется как сумма вероятностей исходов, удовлетворяющих событию; например, вероятность события «на кубике выпало четное число» равна

Напротив, когда случайная величина принимает значения из континуума, то, как правило, любой отдельный результат имеет нулевую вероятность, и только события, которые включают бесконечно много результатов, таких как интервалы, могут иметь положительную вероятность. Например, рассмотрите измерение веса куска ветчины в супермаркете и предположите, что весы имеют многоразрядную точность. Вероятность того, что он весит ровно 500 г, равна нулю, так как он, скорее всего, будет иметь несколько ненулевых десятичных цифр. Тем не менее, при контроле качества можно потребовать, чтобы упаковка ветчины «500 г» весила от 490 г до 510 г с вероятностью не менее 98%, и это требование менее чувствительно к точности измерительных приборов.

Непрерывные распределения вероятностей можно описать несколькими способами. Функция плотности вероятности описывает бесконечно малую вероятность любого заданного значения, и вероятность того, что результат находится в заданном интервале, может быть вычислена путем интегрирования функции плотности вероятности по этому интервалу. [5] Альтернативное описание распределения осуществляется с помощью кумулятивной функции распределения , которая описывает вероятность того, что случайная величина не больше заданного значения (т . е. для некоторого ). Кумулятивная функция распределения представляет собой площадь под функцией плотности вероятности от до, как показано на картинке справа. [6]


Функция массы вероятности (pmf) задает распределение вероятности для суммы отсчетов от двух игральных костей . Например, на рисунке показано, что . PMF позволяет вычислять вероятности таких событий, как , и всех других вероятностей в распределении.
Слева — функция плотности вероятности. Справа — кумулятивная функция распределения, представляющая собой площадь под кривой плотности вероятности.
Функция плотности вероятности (PDF) нормального распределения , также называемая гауссовой или «гауссовой кривой», является наиболее важным непрерывным случайным распределением. Как отмечено на рисунке, вероятности интервалов значений соответствуют площади под кривой.
Функция массы вероятности дискретного распределения вероятностей. Вероятности синглетонов {1}, {3} и {7} равны соответственно 0,2, 0,5, 0,3. Множество, не содержащее ни одной из этих точек, имеет нулевую вероятность.
CDF дискретного распределения вероятностей, ...
... непрерывного распределения вероятностей, ...
... распределения, которое имеет как непрерывную часть, так и дискретную часть.
Одно решение уравнений Рабиновича–Фабриканта . Какова вероятность наблюдения состояния на определенном месте опоры (т. е. красном подмножестве)?