Эта статья требует дополнительных ссылок для проверки . ( май 2011 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
Бинарная классификация - это задача классификации элементов набора на две группы на основе правила классификации . Типичные проблемы бинарной классификации включают:
- Медицинское обследование для определения наличия у пациента определенного заболевания;
- Контроль качества в промышленности, определение соответствия спецификации;
- При поиске информации - принятие решения о том, должна ли страница быть в наборе результатов поиска или нет.
Бинарная классификация - это дихотомия, применяемая к практической ситуации. Во многих практических задачах бинарной классификации эти две группы не являются симметричными, и вместо общей точности представляет интерес относительная доля различных типов ошибок . Например, в медицинском тестировании обнаружение болезни, когда ее нет ( ложноположительный результат ), рассматривается иначе, чем невыявление болезни, когда она присутствует ( ложноотрицательный результат ).
Статистическая двоичная классификация [ править ]
Статистическая классификация - это проблема, изучаемая в машинном обучении . Это тип обучения с учителем, метод машинного обучения, в котором категории предопределены, и используется для категоризации новых вероятностных наблюдений по указанным категориям. Когда есть только две категории, проблема известна как статистическая двоичная классификация.
Некоторые из методов, обычно используемых для двоичной классификации:
- Деревья решений
- Случайные леса
- Байесовские сети
- Опорные векторные машины
- Нейронные сети
- Логистическая регрессия
- Пробит модель
Каждый классификатор лучше всего подходит только для выбранной области на основе количества наблюдений, размерности вектора признаков , шума в данных и многих других факторов. Например, случайные леса работают лучше, чем классификаторы SVM для трехмерных облаков точек. [1] [2]
Оценка бинарных классификаторов [ править ]
Есть много показателей, которые можно использовать для измерения производительности классификатора или предиктора; разные поля имеют разные предпочтения для конкретных показателей из-за разных целей. В медицине часто используются чувствительность и специфичность , тогда как при извлечении информации предпочтительны точность и отзыв . Важное различие заключается между метриками, которые не зависят от того, как часто каждая категория встречается в популяции ( распространенность ), и метриками, которые зависят от распространенности - оба типа полезны, но имеют очень разные свойства.
Учитывая классификацию конкретного набора данных, существует четыре основных комбинации категории фактических данных и присвоенной категории: истинно положительные TP (правильные положительные присвоения), истинно отрицательные TN (правильные отрицательные присвоения), ложные положительные результаты FP (неправильные положительные назначения) и ложноотрицательные FN (неверные отрицательные отнесения).
Состояние положительное | Состояние отрицательное | |
---|---|---|
Результат теста положительный | Истинно положительный | Ложный положительный результат |
Результат теста отрицательный | Ложноотрицательный | Истинно отрицательный |
Они могут быть организованы в таблицу непредвиденных обстоятельств 2 × 2 , в которой столбцы соответствуют фактическому значению - положительному условию или отрицательному условию - и строкам, соответствующим классификационному значению - результат теста положительный или результат теста отрицательный.
Восемь основных соотношений [ править ]
Есть восемь основных соотношений, которые можно вычислить из этой таблицы, которые входят в четыре дополнительные пары (каждая пара в сумме равна 1). Они получаются путем деления каждого из четырех чисел на сумму его строки или столбца, что дает восемь чисел, на которые в общем случае можно ссылаться в форме «истинно положительное соотношение строк» или «ложно отрицательное соотношение столбцов».
Таким образом, есть две пары соотношений столбцов и две пары соотношений строк, и их можно суммировать с помощью четырех чисел, выбрав одно соотношение из каждой пары - остальные четыре числа являются дополнительными.
Соотношения столбцов:
- истинно положительный показатель (TPR) = (TP / (TP + FN)), также известный как чувствительность или отзыв . Это доля населения с состоянием, при котором тест является правильным.
- с дополнением ложноотрицательный показатель (FNR) = (FN / (TP + FN))
- истинно отрицательная скорость (TNR) = (TN / (TN + FP), также известная как специфичность (SPC),
- с дополнительным ложноположительным уровнем (FPR) = (FP / (TN + FP)), также называемым независимо от распространенности
Соотношения строк следующие:
- положительная прогностическая ценность (PPV, также известная как точность ) (TP / (TP + FP)). Это доля населения с данным результатом теста, для которого тест является правильным.
- с дополнением к коэффициенту ложного обнаружения (FDR) (FP / (TP + FP))
- отрицательная прогностическая ценность (NPV) (TN / (TN + FN))
- с дополнением к ложному пропуску (FOR) (FN / (TN + FN)), также называемому зависимостью от распространенности.
В диагностическом тестировании основными используемыми соотношениями являются истинные соотношения столбцов - истинно положительный показатель и истинно отрицательный показатель - где они известны как чувствительность и специфичность . В информационном поиске основными отношениями являются истинно положительные отношения (строка и столбец) - положительная прогностическая ценность и истинно положительный коэффициент - где они известны как точность и отзыв .
Можно взять отношения из дополнительной пары отношений, что даст четыре отношения правдоподобия ( отношение соотношений по двум столбцам, отношение соотношений по двум строкам). В первую очередь это делается для соотношений столбцов (условий), что дает отношения правдоподобия при диагностическом тестировании . Взятие отношения одной из этих групп соотношений дает окончательное соотношение, диагностическое отношение шансов (DOR). Это также можно определить напрямую как (TP × TN) / (FP × FN) = (TP / FN) / (FP / TN); это имеет полезную интерпретацию - как отношение шансов - и не зависит от распространенности.
Существует ряд других показателей, наиболее просто точность или правильная фракция (FC), которая измеряет долю всех экземпляров, которые правильно классифицированы; дополнение - это неправильная дробь (FiC). F-балл сочетает точность и напомним , в одно число с помощью выбора взвешивания, наиболее просто равна весом, как сбалансированный F-счет ( F1 , оценка ). Некоторые показатели берутся из коэффициентов регрессии : отмеченности и информированности , а также их среднего геометрического , коэффициента корреляции Мэтьюза . Другие показатели включают статистику Юдена J , коэффициент неопределенности ,коэффициент фи и каппа Коэна .
Преобразование непрерывных значений в двоичные [ править ]
Тесты, результаты которых представляют собой непрерывные значения, такие как большинство значений крови , могут быть искусственно сделаны бинарными путем определения порогового значения , при этом результаты теста обозначаются как положительные или отрицательные в зависимости от того, является ли результирующее значение выше или ниже порогового значения.
Однако такое преобразование приводит к потере информации, поскольку результирующая двоичная классификация не показывает, насколько значение выше или ниже порогового значения. В результате при преобразовании непрерывного значения, близкого к пороговому значению, в двоичное, результирующее положительное или отрицательное прогнозируемое значение обычно выше, чем прогнозное значение, полученное непосредственно из непрерывного значения. В таких случаях обозначение теста как положительного или отрицательного дает видимость неоправданно высокой достоверности, в то время как значение фактически находится в интервале неопределенности. Например, если концентрация ХГЧ в моче является непрерывным значением, тест на беременность в мочето, что измерено 52 мМЕ / мл ХГЧ, может отображаться как «положительное» с 50 мМЕ / мл в качестве отсечки, но на самом деле находится в интервале неопределенности, которая может быть очевидна только при знании исходного непрерывного значения. С другой стороны, результат теста, очень далекого от порогового значения, обычно имеет результирующее положительное или отрицательное прогнозное значение, которое ниже, чем прогнозируемое значение, полученное на основе непрерывного значения. Например, значение ХГЧ в моче, равное 200 000 мМЕ / мл, дает очень высокую вероятность беременности, но преобразование в двоичные значения приводит к тому, что он показывает столь же «положительный», как и значение 52 мМЕ / мл.
См. Также [ править ]
- Примеры байесовского вывода
- Правило классификации
- Матрица путаницы
- Теория обнаружения
- Методы ядра
- Мультиклассовая классификация
- Классификация с несколькими этикетками
- Одноклассовая классификация
- Ошибка прокурора
- Рабочая характеристика приемника
- Пороговая обработка (обработка изображений)
- Коэффициент неопределенности , он же уровень владения
- Качественная недвижимость
Ссылки [ править ]
- ^ Чжан и Захор, Ричард и Авидех (2014). «Автоматическая идентификация оконных областей на внутренних облаках точек с помощью LiDAR и камер». Публикации VIP Lab . CiteSeerX 10.1.1.649.303 .
- Перейти ↑ Y. Lu and C. Rasmussen (2012). «Упрощенные марковские случайные поля для эффективной семантической маркировки трехмерных облаков точек» (PDF) . IROS .
Библиография [ править ]
- Нелло Кристианини и Джон Шоу-Тейлор . Введение в опорные векторные машины и другие методы обучения на основе ядра . Cambridge University Press, 2000. ISBN 0-521-78019-5 ( [1] Книга SVM)
- Джон Шоу-Тейлор и Нелло Кристианини. Методы ядра для анализа паттернов . Cambridge University Press, 2004. ISBN 0-521-81397-2 ( Веб-сайт книги )
- Бернхард Шёлкопф и А. Дж. Смола: обучение с помощью ядер . MIT Press, Кембридж, Массачусетс, 2002. ISBN 0-262-19475-9