Из Википедии, бесплатной энциклопедии
  (Перенаправлен из двоичного теста )
Перейти к навигации Перейти к поиску

Бинарная классификация - это задача классификации элементов набора на две группы на основе правила классификации . Типичные проблемы бинарной классификации включают:

Бинарная классификация - это дихотомия, применяемая к практической ситуации. Во многих практических задачах бинарной классификации эти две группы не являются симметричными, и вместо общей точности представляет интерес относительная доля различных типов ошибок . Например, в медицинском тестировании обнаружение болезни, когда ее нет ( ложноположительный результат ), рассматривается иначе, чем невыявление болезни, когда она присутствует ( ложноотрицательный результат ).

Статистическая двоичная классификация [ править ]

Статистическая классификация - это проблема, изучаемая в машинном обучении . Это тип обучения с учителем, метод машинного обучения, в котором категории предопределены, и используется для категоризации новых вероятностных наблюдений по указанным категориям. Когда есть только две категории, проблема известна как статистическая двоичная классификация.

Некоторые из методов, обычно используемых для двоичной классификации:

Каждый классификатор лучше всего подходит только для выбранной области на основе количества наблюдений, размерности вектора признаков , шума в данных и многих других факторов. Например, случайные леса работают лучше, чем классификаторы SVM для трехмерных облаков точек. [1] [2]

Оценка бинарных классификаторов [ править ]

В этом наборе тестируемых экземпляров экземпляры, оставшиеся от разделителя, имеют проверяемое условие; правая половина нет. Овал ограничивает те экземпляры, которые алгоритм тестирования классифицирует как имеющие условие. Зеленые области выделяют экземпляры, которые алгоритм тестирования правильно классифицировал. Этикетки относятся к:
TP = истинно положительный результат; TN = истинно отрицательный; FP = ложное срабатывание (ошибка I типа); FN = ложноотрицательный (ошибка типа II); TPR = набор экземпляров для определения истинно положительной скорости; FPR = набор экземпляров для определения количества ложных срабатываний; PPV = положительная прогностическая ценность; NPV = отрицательная прогностическая ценность.

Есть много показателей, которые можно использовать для измерения производительности классификатора или предиктора; разные поля имеют разные предпочтения для конкретных показателей из-за разных целей. В медицине часто используются чувствительность и специфичность , тогда как при извлечении информации предпочтительны точность и отзыв . Важное различие заключается между метриками, которые не зависят от того, как часто каждая категория встречается в популяции ( распространенность ), и метриками, которые зависят от распространенности - оба типа полезны, но имеют очень разные свойства.

Учитывая классификацию конкретного набора данных, существует четыре основных комбинации категории фактических данных и присвоенной категории: истинно положительные TP (правильные положительные присвоения), истинно отрицательные TN (правильные отрицательные присвоения), ложные положительные результаты FP (неправильные положительные назначения) и ложноотрицательные FN (неверные отрицательные отнесения).

Они могут быть организованы в таблицу непредвиденных обстоятельств 2 × 2 , в которой столбцы соответствуют фактическому значению - положительному условию или отрицательному условию - и строкам, соответствующим классификационному значению - результат теста положительный или результат теста отрицательный.

Восемь основных соотношений [ править ]

Есть восемь основных соотношений, которые можно вычислить из этой таблицы, которые входят в четыре дополнительные пары (каждая пара в сумме равна 1). Они получаются путем деления каждого из четырех чисел на сумму его строки или столбца, что дает восемь чисел, на которые в общем случае можно ссылаться в форме «истинно положительное соотношение строк» ​​или «ложно отрицательное соотношение столбцов».

Таким образом, есть две пары соотношений столбцов и две пары соотношений строк, и их можно суммировать с помощью четырех чисел, выбрав одно соотношение из каждой пары - остальные четыре числа являются дополнительными.

Соотношения столбцов:

  • истинно положительный показатель (TPR) = (TP / (TP + FN)), также известный как чувствительность или отзыв . Это доля населения с состоянием, при котором тест является правильным.
    • с дополнением ложноотрицательный показатель (FNR) = (FN / (TP + FN))
  • истинно отрицательная скорость (TNR) = (TN / (TN + FP), также известная как специфичность (SPC),
    • с дополнительным ложноположительным уровнем (FPR) = (FP / (TN + FP)), также называемым независимо от распространенности

Соотношения строк следующие:

  • положительная прогностическая ценность (PPV, также известная как точность ) (TP / (TP + FP)). Это доля населения с данным результатом теста, для которого тест является правильным.
    • с дополнением к коэффициенту ложного обнаружения (FDR) (FP / (TP + FP))
  • отрицательная прогностическая ценность (NPV) (TN / (TN + FN))
    • с дополнением к ложному пропуску (FOR) (FN / (TN + FN)), также называемому зависимостью от распространенности.

В диагностическом тестировании основными используемыми соотношениями являются истинные соотношения столбцов - истинно положительный показатель и истинно отрицательный показатель - где они известны как чувствительность и специфичность . В информационном поиске основными отношениями являются истинно положительные отношения (строка и столбец) - положительная прогностическая ценность и истинно положительный коэффициент - где они известны как точность и отзыв .

Можно взять отношения из дополнительной пары отношений, что даст четыре отношения правдоподобия ( отношение соотношений по двум столбцам, отношение соотношений по двум строкам). В первую очередь это делается для соотношений столбцов (условий), что дает отношения правдоподобия при диагностическом тестировании . Взятие отношения одной из этих групп соотношений дает окончательное соотношение, диагностическое отношение шансов (DOR). Это также можно определить напрямую как (TP × TN) / (FP × FN) = (TP / FN) / (FP / TN); это имеет полезную интерпретацию - как отношение шансов - и не зависит от распространенности.

Существует ряд других показателей, наиболее просто точность или правильная фракция (FC), которая измеряет долю всех экземпляров, которые правильно классифицированы; дополнение - это неправильная дробь (FiC). F-балл сочетает точность и напомним , в одно число с помощью выбора взвешивания, наиболее просто равна весом, как сбалансированный F-счет ( F1 , оценка ). Некоторые показатели берутся из коэффициентов регрессии : отмеченности и информированности , а также их среднего геометрического , коэффициента корреляции Мэтьюза . Другие показатели включают статистику Юдена J , коэффициент неопределенности ,коэффициент фи и каппа Коэна .

Преобразование непрерывных значений в двоичные [ править ]

Тесты, результаты которых представляют собой непрерывные значения, такие как большинство значений крови , могут быть искусственно сделаны бинарными путем определения порогового значения , при этом результаты теста обозначаются как положительные или отрицательные в зависимости от того, является ли результирующее значение выше или ниже порогового значения.

Однако такое преобразование приводит к потере информации, поскольку результирующая двоичная классификация не показывает, насколько значение выше или ниже порогового значения. В результате при преобразовании непрерывного значения, близкого к пороговому значению, в двоичное, результирующее положительное или отрицательное прогнозируемое значение обычно выше, чем прогнозное значение, полученное непосредственно из непрерывного значения. В таких случаях обозначение теста как положительного или отрицательного дает видимость неоправданно высокой достоверности, в то время как значение фактически находится в интервале неопределенности. Например, если концентрация ХГЧ в моче является непрерывным значением, тест на беременность в мочето, что измерено 52 мМЕ / мл ХГЧ, может отображаться как «положительное» с 50 мМЕ / мл в качестве отсечки, но на самом деле находится в интервале неопределенности, которая может быть очевидна только при знании исходного непрерывного значения. С другой стороны, результат теста, очень далекого от порогового значения, обычно имеет результирующее положительное или отрицательное прогнозное значение, которое ниже, чем прогнозируемое значение, полученное на основе непрерывного значения. Например, значение ХГЧ в моче, равное 200 000 мМЕ / мл, дает очень высокую вероятность беременности, но преобразование в двоичные значения приводит к тому, что он показывает столь же «положительный», как и значение 52 мМЕ / мл.

См. Также [ править ]

  • Примеры байесовского вывода
  • Правило классификации
  • Матрица путаницы
  • Теория обнаружения
  • Методы ядра
  • Мультиклассовая классификация
  • Классификация с несколькими этикетками
  • Одноклассовая классификация
  • Ошибка прокурора
  • Рабочая характеристика приемника
  • Пороговая обработка (обработка изображений)
  • Коэффициент неопределенности , он же уровень владения
  • Качественная недвижимость

Ссылки [ править ]

  1. ^ Чжан и Захор, Ричард и Авидех (2014). «Автоматическая идентификация оконных областей на внутренних облаках точек с помощью LiDAR и камер». Публикации VIP Lab . CiteSeerX  10.1.1.649.303 .
  2. Перейти ↑ Y. Lu and C. Rasmussen (2012). «Упрощенные марковские случайные поля для эффективной семантической маркировки трехмерных облаков точек» (PDF) . IROS .

Библиография [ править ]

  • Нелло Кристианини и Джон Шоу-Тейлор . Введение в опорные векторные машины и другие методы обучения на основе ядра . Cambridge University Press, 2000. ISBN 0-521-78019-5 ( [1] Книга SVM) 
  • Джон Шоу-Тейлор и Нелло Кристианини. Методы ядра для анализа паттернов . Cambridge University Press, 2004. ISBN 0-521-81397-2 ( Веб-сайт книги ) 
  • Бернхард Шёлкопф и А. Дж. Смола: обучение с помощью ядер . MIT Press, Кембридж, Массачусетс, 2002. ISBN 0-262-19475-9