Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Теория достоверности - это форма статистического вывода, используемая для прогнозирования неопределенного будущего события, разработанная Томасом Байесом . Его можно использовать, когда у вас есть несколько оценок будущего события, и вы хотите объединить эти оценки таким образом, чтобы получить более точную и актуальную оценку. Обычно это используется актуариями, работающими в страховых компаниях, при определении стоимости страховых взносов. Например, в групповом медицинском страховании страховщик заинтересован в расчете премии за риск (т. Е. Теоретической ожидаемой суммы страховых возмещений) для конкретного работодателя в следующем году. Страховщик, скорее всего, будет иметь оценку исторического опыта общих претензий,, а также более конкретную оценку для рассматриваемого работодателя . Присвоение коэффициента достоверности общему опыту страховых случаев (и взаимному опыту работодателя) позволяет страховщику получить более точную оценку премии за риск следующим образом:

Коэффициент достоверности выводится путем вычисления оценки максимального правдоподобия, которая минимизирует ошибку оценки. Предполагая, что дисперсия и являются известными величинами, принимающими значения и соответственно, можно показать, что они должны быть равны:

Следовательно, чем больше неопределенности в оценке, тем ниже ее достоверность.

Типы достоверности [ править ]

В байесовском праве мы разделяем каждый класс (B) и присваиваем им вероятность (вероятность B). Затем мы выясняем, насколько вероятно, что наш опыт (A) соответствует каждому классу (вероятность A для данного B). Затем мы выясняем, насколько вероятно, что наш опыт был для всех классов (вероятность A). Наконец, мы можем найти вероятность нашего класса с учетом нашего опыта. Итак, возвращаясь к каждому классу, мы взвешиваем каждую статистику с вероятностью конкретного класса с учетом опыта.

Доверие к Бюльманну основывается на анализе дисперсии среди населения. В частности, он пытается увидеть, какая часть общей дисперсии отнесена к дисперсии ожидаемых значений каждого класса (дисперсия гипотетического среднего), а какая - к ожидаемой дисперсии по всем классам (ожидаемое значение Дисперсия процесса). Допустим, у нас есть баскетбольная команда с большим количеством очков за игру. Иногда они получают 128, а иногда 130, но всегда одно из двух. По сравнению со всеми баскетбольными командами это относительно невысокая дисперсия, что означает, что они очень мало влияют на ожидаемую ценность дисперсии процесса. Кроме того, их необычно высокое количество очков значительно увеличивает дисперсию населения, а это означает, что если лига выгнала их, ониd иметь гораздо более предсказуемую сумму очков для каждой команды (меньшая дисперсия). Итак, эта команда определенно уникальна (они вносят большой вклад в дисперсию гипотетического среднего). Так что мы можем оценить опыт этой команды с довольно высоким уровнем доверия. Они часто / всегда набирают много очков (низкое ожидаемое значение дисперсии процесса), и не многие команды получают столько же результатов (высокая дисперсия гипотетического среднего).

Простой пример [ править ]

Предположим, в коробке две монеты. У одной с обеих сторон орла, а у другой - обычная монета с вероятностью выпадения орла или решки 50:50. Вам нужно сделать ставку на результат после того, как он будет случайно выбран и перевернут.

Вероятность выпадения орла составляет 0,5 * 1 + 0,5 * 0,5 = 0,75. Это потому, что есть шанс 0,5 выбрать монету, состоящую только из орла, с вероятностью 100% и шанс 0,5 для справедливой монеты с вероятностью 50%.

Теперь эта же монета используется повторно, и вас снова просят сделать ставку на результат.

Если при первом броске выпала решка, есть 100% шанс, что вы имеете дело с честной монетой, поэтому при следующем броске вероятность выпадения орла составляет 50%, а вероятность выпадения решки - 50%.

Если первый бросок выпадал орлом, мы должны вычислить условную вероятность того, что выбранная монета была только орлом, а также условную вероятность того, что монета была честной, после чего мы можем вычислить условную вероятность выпадения орла при следующем подбрасывании. Вероятность того, что он выпал из монетки, состоящей только из орлов, при условии, что первым подбрасыванием орла был орел, равна вероятности выбора монетки с одним орлом, умноженной на вероятность выпадения орла для этой монеты, деленную на начальную вероятность выпадения орла при первом подбрасывании, или. 5 * 1 / 0,75 = 2/3. Вероятность того, что он выпал из честной монеты, с учетом того, что при первом подбрасывании орла выпадал орел, равна вероятности выбора справедливой монеты, умноженной на вероятность выпадения орла для этой монеты, деленную на начальную вероятность выпадения орла при первом подбрасывании, или 0,5 * 0,5 / 0,75 = 1/3. Ну наконец то,условная вероятность выпадения орла при следующем подбрасывании с учетом того, что первым подбрасыванием выпала орла, является условная вероятность выпадения орла, умноженная на вероятность выпадения орла для монетки, состоящей только из орлов, плюс условная вероятность справедливой монеты, умноженная на вероятность выпадения орла. для честной монеты, или 2/3 * 1 + 1/3 * 0,5 = 5/6 ≈ 0,8333.

Актуарная достоверность [ править ]

Актуарная достоверность описывает подход, используемый актуариями для улучшения статистических оценок. Хотя подход может быть сформулирован либо в частотной, либо в байесовской статистической установке, последний часто предпочтительнее из-за простоты распознавания более чем одного источника случайности с помощью как «выборочной», так и «априорной» информации. В типичном приложении актуарий имеет оценку X, основанную на небольшом наборе данных, и оценку M, основанную на более крупном, но менее релевантном наборе данных. Оценка достоверности - ZX + (1-Z) M, [1], где Z - число от 0 до 1 (так называемый «вес достоверности» или «коэффициент достоверности»), вычисленное для уравновешивания ошибки выборки. X на фоне возможной несоответствия (и, следовательно, ошибки моделирования) M.

Когда страховая компания рассчитывает размер страховой премии, она делит страхователей на группы. Например, водители могут быть разделены по возрасту, полу и типу автомобиля; молодой человек, ведущий быструю машину, считается высоким риском, а старуха, ведущая маленькую машину, считается низким риском. Разделение производится с учетом двух требований: риски в каждой группе достаточно схожи, а группа достаточно велика, чтобы иметь значимые статистические данные.Для расчета страховой премии можно провести анализ претензионного опыта. Этот компромисс означает, что ни одна из групп не содержит только идентичных рисков. Тогда проблема состоит в том, чтобы разработать способ сочетания опыта группы с опытом индивидуального риска, чтобы лучше рассчитать размер премии. Теория достоверности дает решение этой проблемы.

Для актуариев важно знать теорию достоверности, чтобы рассчитать премию по группе договоров страхования . Цель состоит в том, чтобы создать систему оценки опыта для определения премии в следующем году, принимая во внимание не только индивидуальный опыт работы в группе, но и коллективный опыт.

Есть две крайние позиции. Один из них - взимать со всех одинаковую премию, рассчитанную на основе общего среднего значения данных. Это имеет смысл только в том случае, если портфель однороден, что означает, что все ячейки рисков имеют одинаковые средние требования. Однако, если портфель неоднороден, не рекомендуется взимать премию таким образом (завышая плату за «хороших» людей и занижая цену за «плохих» людей риска), поскольку «хорошие» риски унесут их бизнес в другое место, оставляя страховщика только с «плохими» рисками. Это пример неблагоприятного отбора .

Другой способ состоит в том, чтобы взимать плату за группировку своих средних требований в качестве премии, взимаемой с застрахованного. Эти методы используются, если портфель неоднороден при условии достаточно большого количества претензий. Чтобы скомпрометировать эти две крайние позиции, мы берем средневзвешенное значение из двух крайностей:

имеет следующий интуитивный смысл: он выражает, насколько «заслуживающим доверия» (приемлемым) является индивидуум клетки . Если он высокий, используйте больший вес, чтобы придать больший вес начислению , и в этом случае это называется фактором надежности, а такая начисленная премия называется премией за доверие.

Если бы группа была полностью однородной, то было бы разумно установить , а если бы группа была полностью неоднородной, то было бы разумно установить . Использование промежуточных значений разумно в той степени, в которой как индивидуальная, так и групповая история полезна для вывода о будущем индивидуальном поведении.

Например, у актуария есть исторические данные о несчастных случаях и заработной плате на обувной фабрике, предполагающие, что коэффициент несчастных случаев составляет 3,1 на миллион долларов заработной платы. У нее есть отраслевая статистика (основанная на всех обувных фабриках), согласно которой уровень несчастных случаев составляет 7,4 на миллион. С вероятностью Z, равной 30%, она оценила бы коэффициент для завода как 30% (3,1) + 70% (7,4) = 6,1 аварий на миллион.

Ссылки [ править ]

Дальнейшее чтение [ править ]

  • Бехан, Дональд Ф. (2009) "Теория статистической достоверности" , Юго-восточная актуарная конференция, 18 июня 2009 г.
  • Longley-Cook, LH (1962) Введение в теорию достоверности PCAS, 49, 194-221.
  • Mahler, Howard C .; Дин, Кертис Гэри (2001). «Глава 8: Достоверность» (PDF) . В Актуарном обществе несчастных случаев (ред.). Основы актуарной науки о несчастных случаях (4-е изд.). Актуарное общество по несчастным случаям . С. 485–659. ISBN 978-0-96247-622-8. Проверено 25 июня 2015 года .
  • Whitney, AW (1918) The Theory of Experience Rating, Proceedings of the Emerty Actuarial Society, 4, 274-292 (Это одна из оригинальных актуарных статей о потерях, касающихся достоверности. В ней используются байесовские методы, хотя автор использует теперь устаревшие терминология "обратной вероятности".)
  • Вентер, Гэри Г. (2005) " Теория достоверности для чайников "