Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Оценка Брайера - это строго правильная функция оценки или строго правильное правило оценки, которое измеряет точность вероятностных прогнозов . Для одномерных прогнозов он строго эквивалентен среднеквадратической ошибке, применяемой к прогнозируемым вероятностям.

Оценка Бриера применима к задачам, в которых прогнозы должны назначать вероятности набору взаимоисключающих дискретных результатов или классов. Набор возможных результатов может быть бинарным или категориальным по своей природе, и вероятности, присвоенные этому набору результатов, должны в сумме равняться единице (где каждая индивидуальная вероятность находится в диапазоне от 0 до 1). Он был предложен Гленном В. Брайером в 1950 году. [1]

Показатель Брайера можно рассматривать как функцию стоимости . Точнее, по всем элементам набора из N прогнозов показатель Бриера измеряет среднеквадратичную разницу между:

  • Прогнозируемая вероятность, присвоенная возможным результатам для пункта i.
  • Фактический результат

Следовательно, чем ниже оценка Бриера для набора прогнозов, тем лучше они откалиброваны. Обратите внимание, что показатель Бриера в его наиболее распространенной формулировке принимает значение от нуля до единицы, поскольку это квадрат наибольшей возможной разницы между предсказанной вероятностью (которая должна быть между нулем и единицей) и фактическим результатом (которая может принимать значения только 0 или 1). В первоначальной (1950 г.) формулировке шкалы Брайера диапазон удваивается, от нуля до двух.

Оценка Бриера подходит для двоичных и категориальных результатов, которые могут быть структурированы как истинные или ложные, но не подходит для порядковых переменных, которые могут принимать три или более значений.

Определение [ править ]

Наиболее распространенная формулировка оценки Брайера:

где - вероятность, которая была спрогнозирована, фактический исход события в конкретном случае ( если оно не происходит и если оно действительно происходит) и является количеством экземпляров прогнозирования. По сути, это среднеквадратичная ошибка прогноза. Эта формулировка в основном используется для двоичных событий (например, «дождь» или «без дождя»). Вышеприведенное уравнение является правильным правилом оценки только для двоичных событий; если должен оцениваться прогноз по нескольким категориям, то следует использовать исходное определение, данное Бриером ниже.

Пример [ править ]

Предположим, что кто-то прогнозирует вероятность того, что в данный день пойдет дождь. Затем оценка Бриера рассчитывается следующим образом:

  • Если прогноз равен 100% ( = 1) и идет дождь, то оценка Бриера равна 0, что является наилучшей достижимой оценкой.
  • Если прогноз 100% и дождь не идет, то оценка Бриера равна 1, что является наихудшим из возможных результатов.
  • Если прогноз составляет 70% ( = 0,70) и идет дождь, то оценка Бриера составляет (0,70–1) 2  = 0,09.
  • Напротив, если прогноз составляет 70% ( = 0,70) и не идет дождь, то оценка Бриера составляет (0,70-0) 2  = 0,49.
  • Точно так же, если прогноз 30% ( = 0,30) и идет дождь, то оценка Бриера будет (0,30–1) 2  = 0,49.
  • Если прогноз составляет 50% ( = 0,50), то оценка Бриера будет (0,50–1) 2  = (0,50–0) 2  = 0,25, независимо от того, идет ли дождь.

Оригинальное определение Брайера [ править ]

Хотя приведенная выше формулировка является наиболее широко используемой, исходное определение Бриера [1] применимо к прогнозам с несколькими категориями, а также остается правильным правилом оценки, в то время как двоичная форма (используемая в приведенных выше примерах) является только правильной. для двоичных событий. Для бинарных прогнозов исходная формулировка «вероятностной оценки Бриера» имеет вдвое большее значение, чем оценка, известная в настоящее время как оценка Брайера.

В котором есть число возможных классов , в которых событие может упасть, и общее число экземпляров всех классов. Для случая дождя / дождя, , в то время как для прогноза холодного / Normal / тепло, .

Разложения [ править ]

Существует несколько декомпозиций оценки Бриера, которые обеспечивают более глубокое понимание поведения двоичного классификатора.

3-компонентная декомпозиция [ править ]

Оценка Бриера может быть разделена на 3 дополнительных компонента: неопределенность, надежность и разрешающая способность. (Мерфи 1973) [2]

Каждый из этих компонентов может быть дополнительно разложен в соответствии с количеством возможных классов, в которые может попасть событие. Злоупотребление знаком равенства:

Это общее количество выпущенных прогнозов, количество выпущенных уникальных прогнозов, наблюдаемая климатологическая базовая частота возникновения события, количество прогнозов с той же категорией вероятности и наблюдаемая частота с учетом прогнозов вероятности . Жирное обозначение в приведенной выше формуле указывает векторы, что является еще одним способом обозначить исходное определение оценки и разложить его в соответствии с количеством возможных классов, в которые может попасть событие. Например, вероятность дождя 70% и отсутствие дождя обозначаются как и соответственно. Считается, что такие операции, как возведение в квадрат и умножение этих векторов, покомпонентны. В этом случае оценка Брайера представляет собой сумму результирующего вектора в правой части.

Неопределенность [ править ]

Термин неопределенности измеряет неотъемлемую неопределенность результатов события. Для бинарных событий он максимален, когда каждый результат происходит в 50% случаев, и минимален (ноль), если результат всегда возникает или никогда не наступает.

Надежность [ править ]

Термин надежности измеряет, насколько близки вероятности прогноза к истинным вероятностям для данного прогноза. Надежность определяется в противоположном направлении по сравнению с английским языком . Если надежность равна 0, прогноз абсолютно надежен. Например, если мы сгруппируем все случаи прогноза, в которых вероятность дождя составляла 80%, мы получим идеальную надежность только в том случае, если дождь шел 4 из 5 раз после выпуска такого прогноза.

Разрешение [ править ]

Срок разрешения измеряет, насколько условные вероятности с учетом различных прогнозов отличаются от среднего климатического значения. Чем выше этот срок, тем лучше. В худшем случае, когда климатическая вероятность всегда прогнозируется, разрешение равно нулю. В лучшем случае, когда условные вероятности равны нулю и единице, разрешение равно неопределенности.

Двухкомпонентная декомпозиция [ править ]

Альтернативная (и связанная с ней) декомпозиция генерирует два члена вместо трех.

Первый термин известен как калибровка (и может использоваться как мера калибровки, см. Статистическая калибровка ) и равен надежности. Второй член известен как уточнение и представляет собой совокупность разрешающей способности и неопределенности и относится к области под кривой ROC .

Оценка Бриера и разложение CAL + REF могут быть представлены графически с помощью так называемых кривых Бриера [3], где ожидаемые потери показаны для каждого рабочего состояния. Это делает показатель Brier Score мерой совокупной производительности при равномерном распределении асимметрии классов. [4]

Brier Skill Score (BSS) [ править ]

Оценка навыков для данной базовой оценки представляет собой смещенный и (отрицательно) масштабированный вариант базовой оценки, так что нулевое значение оценки навыка означает, что оценка для прогнозов так же хороша, как и у набора базовых или эталонных показателей. или прогнозы по умолчанию, в то время как значение оценки навыка, равное единице (100%), представляет собой наилучшую возможную оценку. Значение оценки навыков меньше нуля означает, что производительность даже хуже, чем у базовых или справочных прогнозов. Когда базовая оценка - это оценка Брайера (BS), оценка навыков Брайера (BSS) рассчитывается как

где - это показатель Брайера справочных или базовых прогнозов, которые мы стремимся улучшить. Хотя эталонные прогнозы в принципе могут быть даны любой ранее существовавшей моделью, по умолчанию можно использовать наивную модель, которая прогнозирует общую долю или частоту данного класса в оцениваемом наборе данных как постоянную прогнозируемую вероятность этого класса. происходит в каждом случае в наборе данных. Эта базовая модель будет представлять собой модель «без навыков», которую нужно улучшить. Оценки навыков берут начало в литературе по метеорологическим прогнозам, где наивные справочные прогнозы по умолчанию называются "климатологическими прогнозами по выборке", где климатология означает долгосрочное или общее среднее значение прогнозов погоды, а средние значения по выборке, рассчитанные на основе настоящего набор данных оценивается.[5][6] В этом случае по умолчанию для бинарной (двухклассовой) классификации эталонная оценка по Бриеру дается следующим образом (с использованием обозначения первого уравнения данной статьи в верхней части раздела «Определение»):

где - это просто средний фактический результат, то есть общая доля истинного класса 1 в наборе данных:

При оценке по Брайеру, чем ниже, тем лучше (это функция потерь), где 0 - это наилучший возможный результат. Но с оценкой навыка Брайера, чем выше, тем лучше, причем 1 (100%) является наилучшим возможным результатом.

Оценка навыков Бриера может быть более интерпретируемой, чем оценка Бриера, потому что BSS - это просто процентное улучшение BS по сравнению с эталонной моделью, а отрицательный BSS означает, что вы делаете даже хуже, чем эталонная модель, что может быть неочевидно из глядя на саму оценку шиповника. Однако обычно не следует ожидать BSS, близкого к 100%, потому что для этого потребуется, чтобы каждое предсказание вероятности было примерно 0 или 1 (и, конечно, было правильным).

Поскольку оценка Brier - это строго правильное правило оценки , а BSS - это просто его аффинное преобразование, BSS также является строго правильным правилом оценки.

Вы могли заметить, что BSS классификации (оценки вероятности) относится к ее BS, а коэффициент детерминации регрессии ( ) относится к ее среднеквадратичной ошибке (MSE).

Недостатки [ править ]

Оценка Бриера становится недостаточной для очень редких (или очень частых) событий, потому что она не позволяет в достаточной степени различать небольшие изменения прогноза, значимые для редких событий. [7] Wilks (2010) обнаружил, что «[Q] uite большие размеры выборки, то есть n> 1000, требуются для высококвалифицированных прогнозов относительно редких событий, тогда как только довольно скромные размеры требуются для низкоквалифицированных прогнозов общие события ". [8]

См. Также [ править ]

  • Навык прогнозирования
  • Правило подсчета очков

Ссылки [ править ]

Ноты
  1. ^ а б Брайер (1950). «Проверка прогнозов, выраженных в терминах вероятности» (PDF) . Ежемесячный обзор погоды . 78 : 1–3. DOI : 10.1175 / 1520-0493 (1950) 078 <0001: vofeit> 2.0.co; 2 . Архивировано из оригинального (PDF) 23 октября 2017 года.
  2. ^ Мерфи, AH (1973). «Новое векторное разбиение оценки вероятности» . Журнал прикладной метеорологии . 12 (4): 595–600. DOI : 10,1175 / 1520-0450 (1973) 012 <0595: ANVPOT> 2.0.CO; 2 .
  3. ^ Эрнандес-Оралло, Дж .; Flach, PA; Ферри, К. (2011). «Кривые Бриера: новая визуализация производительности классификатора на основе затрат» (PDF) . Материалы 28-й Международной конференции по машинному обучению (ICML-11) . С. 585–592.
  4. ^ Эрнандес-Оралло, Дж .; Flach, PA; Ферри, К. (2012). «Единое представление метрик производительности: перевод выбора порога в ожидаемую потерю классификации» (PDF) . Журнал исследований в области машинного обучения . 13 : 2813–2869.
  5. ^ Разложение оценки Брайера с поправкой на смещение. (Примечания и переписка.) CAT Ferro и TE Fricker в Ежеквартальном журнале Королевского метеорологического общества , том 138, выпуск 668, октябрь 2012 г. Часть A, страницы 1954-1960 [1]
  6. ^ «Численное прогнозирование погоды: Система краткосрочного ансамблевого прогнозирования MOGREPS: Отчет о проверке: Экспериментальные характеристики MOGREPS: январь 2006 г. - март 2007 г. Технический отчет исследования прогнозирования № 503». Нил Боулер, Мари Дандо, Сара Бир и Кен Милн [2]
  7. ^ Риккардо Бенедетти (01.01.2010). «Правила выставления оценок для проверки прогнозов» . Ежемесячный обзор погоды . 138 (1): 203–211. DOI : 10.1175 / 2009MWR2945.1 .
  8. Перейти ↑ Wilks, DS (2010). «Выборочные распределения оценки Брайера и оценки навыков Брайера при серийной зависимости». Ежеквартальный журнал Королевского метеорологического общества . 136 (1): 2109–2118. DOI : 10.1002 / qj.709 .
Источники
  • Дж. Скотт Армстронг, Принципы прогнозирования .
  • Глоссарий по метеорологии AMS

Внешние ссылки [ править ]

  • Композиция партитуры Бриера: мини-учебник