Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Бинарная классификация - это задача классификации элементов набора на две группы на основе правила классификации . Типичные проблемы бинарной классификации включают:

Бинарная классификация - это дихотомия, применяемая к практической ситуации. Во многих практических задачах бинарной классификации эти две группы не являются симметричными, и вместо общей точности представляет интерес относительная доля различных типов ошибок . Например, при медицинском тестировании обнаружение болезни, когда ее нет ( ложноположительный результат ), рассматривается иначе, чем невыявление болезни при ее наличии ( ложноотрицательный ).

Статистическая двоичная классификация [ править ]

Статистическая классификация - это проблема, изучаемая в машинном обучении . Это тип обучения с учителем, метод машинного обучения, в котором категории предопределены, и используется для категоризации новых вероятностных наблюдений по указанным категориям. Когда есть только две категории, проблема известна как статистическая двоичная классификация.

Некоторые из методов, обычно используемых для двоичной классификации:

Каждый классификатор лучше всего подходит только для выбранной области на основе количества наблюдений, размерности вектора признаков , шума в данных и многих других факторов. Например, случайные леса работают лучше, чем классификаторы SVM для трехмерных облаков точек. [1] [2]

Оценка бинарных классификаторов [ править ]

В этом наборе тестируемых экземпляров экземпляры, оставшиеся от разделителя, имеют проверяемое условие; правая половина нет. Овал ограничивает те экземпляры, которые алгоритм тестирования классифицирует как имеющие условие. Зеленые области выделяют экземпляры, которые алгоритм тестирования правильно классифицировал. Этикетки относятся к:
TP = истинно положительный результат; TN = истинно отрицательный; FP = ложное срабатывание (ошибка I типа); FN = ложноотрицательный (ошибка типа II); TPR = набор экземпляров для определения истинно положительной скорости; FPR = набор экземпляров для определения количества ложных срабатываний; PPV = положительная прогностическая ценность; NPV = отрицательная прогностическая ценность.

Есть много показателей, которые можно использовать для измерения производительности классификатора или предиктора; разные поля имеют разные предпочтения для конкретных показателей из-за разных целей. В медицине часто используются чувствительность и специфичность , тогда как при поиске информации предпочтительны точность и отзыв . Важное различие заключается между метриками, которые не зависят от того, как часто каждая категория встречается в популяции ( распространенность ), и метриками, которые зависят от распространенности - оба типа полезны, но имеют очень разные свойства.

Учитывая классификацию конкретного набора данных, существует четыре основных комбинации категории фактических данных и присвоенной категории: истинно положительные TP (правильные положительные присвоения), истинно отрицательные TN (правильные отрицательные присвоения), ложные положительные результаты FP (неправильные положительные назначения) и ложноотрицательные FN (неправильные отрицательные отнесения).

Они могут быть организованы в таблицу непредвиденных обстоятельств 2 × 2 , в которой столбцы соответствуют фактическому значению - положительному условию или отрицательному условию - и строкам, соответствующим классификационному значению - результат теста положительный или результат теста отрицательный.

Восемь основных соотношений [ править ]

Есть восемь основных соотношений, которые можно вычислить из этой таблицы, которые входят в четыре дополнительные пары (каждая пара в сумме равна 1). Они получаются путем деления каждого из четырех чисел на сумму его строки или столбца, что дает восемь чисел, на которые в общем случае можно ссылаться в форме «истинно положительное соотношение строк» ​​или «ложно отрицательное соотношение столбцов».

Таким образом, есть две пары соотношений столбцов и две пары соотношений строк, и их можно суммировать с помощью четырех чисел, выбрав одно соотношение из каждой пары - остальные четыре числа являются дополнительными.

Соотношения столбцов:

  • истинно положительный показатель (TPR) = (TP / (TP + FN)), также известный как чувствительность или отзыв . Это доля населения с состоянием, при котором тест является правильным.
    • с дополнением ложноотрицательный показатель (FNR) = (FN / (TP + FN))
  • истинно отрицательная скорость (TNR) = (TN / (TN + FP), также известная как специфичность (SPC),
    • с дополнительным ложноположительным уровнем (FPR) = (FP / (TN + FP)), также называемым независимо от распространенности

Соотношения строк следующие:

  • положительная прогностическая ценность (PPV, также известная как точность ) (TP / (TP + FP)). Это доля населения с данным результатом теста, для которого тест является правильным.
    • с дополнением к коэффициенту ложного обнаружения (FDR) (FP / (TP + FP))
  • отрицательная прогностическая ценность (NPV) (TN / (TN + FN))
    • с дополнением к ложному пропуску (FOR) (FN / (TN + FN)), также называемому зависимостью от распространенности.

В диагностическом тестировании основными используемыми соотношениями являются истинные соотношения столбцов - истинно положительный показатель и истинно отрицательный показатель - где они известны как чувствительность и специфичность . В информационном поиске основными отношениями являются истинно положительные отношения (строка и столбец) - положительная прогностическая ценность и истинно положительный коэффициент - где они известны как точность и отзыв .

Можно взять отношения из дополнительной пары отношений, что даст четыре отношения правдоподобия ( отношение соотношений по двум столбцам, соотношение по двум строкам). В первую очередь это делается для соотношений столбцов (условий), что дает отношения правдоподобия при диагностическом тестировании . Взятие отношения одной из этих групп соотношений дает окончательное соотношение, диагностическое отношение шансов (DOR). Это также можно определить напрямую как (TP × TN) / (FP × FN) = (TP / FN) / (FP / TN); это имеет полезную интерпретацию - как отношение шансов - и не зависит от распространенности.

Существует ряд других показателей, наиболее просто точность или правильная фракция (FC), которая измеряет долю всех экземпляров, которые правильно классифицированы; дополнение - это неправильная дробь (FiC). F-балл сочетает точность и напомним , в одно число с помощью выбора взвешивания, наиболее просто равна весом, как сбалансированный F-счет ( F1 , оценка ). Некоторые показатели берутся из коэффициентов регрессии : отмеченности и информированности , а также их среднего геометрического , коэффициента корреляции Мэтьюза . Другие показатели включают статистику Юдена J , коэффициент неопределенности ,коэффициент фи и каппа Коэна .

Преобразование непрерывных значений в двоичные [ править ]

Тесты, результаты которых представляют собой непрерывные значения, такие как большинство значений крови , могут быть искусственно сделаны бинарными путем определения порогового значения , при этом результаты теста обозначаются как положительные или отрицательные в зависимости от того, является ли результирующее значение выше или ниже порогового значения.

Однако такое преобразование приводит к потере информации, поскольку результирующая двоичная классификация не показывает, насколько значение выше или ниже порогового значения. В результате при преобразовании непрерывного значения, близкого к пороговому значению, в двоичное, результирующее положительное или отрицательное прогнозируемое значение обычно выше, чем прогнозное значение, полученное непосредственно из непрерывного значения. В таких случаях обозначение теста как положительного или отрицательного дает видимость неоправданно высокой достоверности, в то время как значение фактически находится в интервале неопределенности. Например, если концентрация ХГЧ в моче является непрерывным значением, тест на беременность в мочерезультат измерения ХГЧ в 52 мМЕ / мл может быть положительным с 50 мМЕ / мл в качестве порогового значения, но на самом деле он находится в интервале неопределенности, которая может быть очевидна только при знании исходного непрерывного значения. С другой стороны, результат теста, находящийся очень далеко от порогового значения, обычно имеет результирующее положительное или отрицательное прогнозное значение, которое ниже, чем прогнозируемое значение, полученное на основе непрерывного значения. Например, значение ХГЧ в моче, равное 200 000 мМЕ / мл, дает очень высокую вероятность беременности, но преобразование в двоичные значения приводит к тому, что он показывает столь же «положительный», как и значение 52 мМЕ / мл.

См. Также [ править ]

  • Примеры байесовского вывода
  • Правило классификации
  • Матрица путаницы
  • Теория обнаружения
  • Методы ядра
  • Мультиклассовая классификация
  • Классификация с несколькими этикетками
  • Одноклассовая классификация
  • Ошибка прокурора
  • Рабочая характеристика приемника
  • Пороговая обработка (обработка изображений)
  • Коэффициент неопределенности , он же уровень владения
  • Качественная недвижимость

Ссылки [ править ]

  1. ^ Чжан и Захор, Ричард и Авидех (2014). «Автоматическая идентификация оконных областей на внутренних облаках точек с помощью LiDAR и камер». Публикации VIP Lab . CiteSeerX  10.1.1.649.303 .
  2. Перейти ↑ Y. Lu and C. Rasmussen (2012). «Упрощенные марковские случайные поля для эффективной семантической маркировки трехмерных облаков точек» (PDF) . IROS .

Библиография [ править ]

  • Нелло Кристианини и Джон Шоу-Тейлор . Введение в опорные векторные машины и другие методы обучения на основе ядра . Cambridge University Press, 2000. ISBN 0-521-78019-5 ( [1] Книга SVM) 
  • Джон Шоу-Тейлор и Нелло Кристианини. Методы ядра для анализа паттернов . Cambridge University Press, 2004. ISBN 0-521-81397-2 ( Веб-сайт книги ) 
  • Бернхард Шёлкопф и А. Дж. Смола: обучение с помощью ядер . MIT Press, Кембридж, Массачусетс, 2002. ISBN 0-262-19475-9