Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Усредненные оценки с одной зависимостью ( AODE ) - это метод обучения вероятностной классификации . Он был разработан для решения проблемы независимости атрибутов популярного наивного байесовского классификатора . Он часто разрабатывает существенно более точные классификаторы, чем наивный байесовский классификатор, за счет небольшого увеличения объема вычислений. [1]

Классификатор AODE [ править ]

AODE пытается оценить вероятность каждого класса y при заданном наборе характеристик x 1 , ... x n , P ( y | x 1 , ... x n ). Для этого используется формула

где обозначает оценку , - частота, с которой аргумент появляется в выборочных данных, а m - заданная пользователем минимальная частота, с которой должен появляться термин, чтобы его можно было использовать во внешнем суммировании. В последнее время m обычно устанавливается равным 1.

Вывод классификатора AODE [ править ]

Мы стремимся оценить P ( y | x 1 , ... x n ). По определению условной вероятности

Для любого ,

В предположении, что x 1 , ... x n независимы при заданных y и x i , отсюда следует, что

Эта формула определяет специальную форму Одной оценки зависимости (ODE), вариант наивного байесовского классификатора, который делает вышеупомянутое предположение независимости, которое является более слабым (и, следовательно, потенциально менее вредным), чем наивное предположение независимости Байеса. Как следствие, каждое ОДУ должно создавать менее предвзятую оценку, чем наивный байесовский метод. Однако, поскольку каждая базовая оценка вероятности обусловлена ​​двумя переменными, а не одной, они формируются из меньшего количества данных (обучающие примеры, удовлетворяющие обеим переменным) и, следовательно, вероятно, будут иметь большую дисперсию. AODE уменьшает эту дисперсию путем усреднения оценок всех таких ODE.

Особенности классификатора AODE [ править ]

Как и наивный байесовский метод, AODE не выполняет выбор модели и не использует настраиваемые параметры. В результате он имеет низкую дисперсию. Он поддерживает инкрементное обучение, благодаря которому классификатор может эффективно обновляться информацией из новых примеров по мере их появления. Он предсказывает вероятности классов, а не просто предсказывает один класс, позволяя пользователю определить уверенность, с которой может быть произведена каждая классификация. Его вероятностная модель может напрямую обрабатывать ситуации, когда некоторые данные отсутствуют.

AODE имеет вычислительную сложность во время обучения и во время классификации, где n - количество функций, l - количество обучающих примеров, а k - количество классов. Это делает его неприменимым к многомерным данным. Однако в рамках этого ограничения он линейен по отношению к количеству обучающих примеров и, следовательно, может эффективно обрабатывать большое количество обучающих примеров.

Реализации [ править ]

Бесплатный набор машинного обучения Weka включает реализацию AODE.

См. Также [ править ]

Ссылки [ править ]