Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

SpamBayes - это байесовский фильтр спама, написанный на Python, который использует методы, изложенные Полом Грэмом в его эссе «План защиты от спама». Впоследствии он был улучшен , среди прочего, Гэри Робинсоном и Тимом Питерсом .

Наиболее заметное различие между обычным байесовским фильтром и фильтром, используемым SpamBayes, состоит в том, что существует три классификации, а не две: спам, не-спам ( в SpamBayes это называется ветчиной ) и неуверенный. Пользователь тренирует сообщение как спам или ветчину; при фильтрации сообщения спам-фильтры генерируют одну оценку для радиолюбителей и другую для спама.

Если рейтинг спама высокий, а рейтинг любительской почты низкий, сообщение будет классифицировано как спам. Если рейтинг спама низкий, а рейтинг любительской почты высокий, сообщение будет классифицировано как ветчина. Если обе оценки высокие или обе низкие, сообщение будет классифицировано как неуверенное.

Такой подход приводит к небольшому количеству ложных срабатываний и ложноотрицательных результатов , но может привести к ряду сомнений, требующих человеческого решения.

Веб-фильтрация [ править ]

Некоторая работа была направлена ​​на применение SpamBayes для фильтрации интернет-контента через прокси-сервер . [2] [3]

Ссылки [ править ]

Внешние ссылки [ править ]