В машинном обучении , ближайший центроид классификатор или ближайший прототип классификатор представляет собой модель классификации , относящих наблюдения метки класса подготовки образцов , чьи средних ( медианы ) находится ближе всего к наблюдению.
При применении к классификации текста с использованием векторов tf * idf для представления документов, классификатор ближайшего центроида известен как классификатор Роккио из-за его сходства с алгоритмом Роккио для обратной связи по релевантности . [1]
Расширенная версия классификатора ближайшего центроида нашла применение в медицине, в частности, для классификации опухолей . [2]
Алгоритм
- Процедура обучения: даны размеченные обучающие выборки с метками класса , вычислить центроиды для каждого класса где - набор индексов выборок, принадлежащих к классу .
- Функция прогноза: класс, присвоенный наблюдению. является .
Смотрите также
Рекомендации
- ^ Мэннинг, Кристофер; Рагхаван, Прабхакар; Шютце, Хинрих (2008). «Классификация векторных пространств». Введение в поиск информации . Издательство Кембриджского университета.
- ^ Тибширани, Роберт ; Хасти, Тревор ; Нарасимхан, Баласубраманиан; Чу, Гилберт (2002). «Диагностика нескольких типов рака по уменьшенным центроидам экспрессии генов» . Труды Национальной академии наук . 99 (10): 6567–6572. DOI : 10.1073 / pnas.082099299 . PMC 124443 . PMID 12011421 .