Из Википедии, бесплатной энциклопедии
  (Перенаправлено из раздела "Фильтрация информации" )
Перейти к навигации Перейти к поиску

Система фильтрации информации - это система, которая удаляет избыточную или нежелательную информацию из информационного потока с использованием (полу) автоматизированных или компьютеризированных методов до представления пользователю-человеку. Его основная цель - управление информационной перегрузкой и увеличение семантического отношения сигнал / шум . Для этого профиль пользователя сравнивается с некоторыми эталонными характеристиками. Эти характеристики могут происходить из информационного элемента (подход, основанный на содержании) или социальной среды пользователя ( подход совместной фильтрации ).

В то время как при передаче информации фильтры обработки сигналов используются против синтаксических помех на битовом уровне, методы, используемые при фильтрации информации, действуют на семантическом уровне.

Набор используемых машинных методов основан на тех же принципах, что и методы извлечения информации . Известное применение можно найти в области фильтров спама в электронной почте . Таким образом, не только информационный взрыв требует определенных фильтров, но и непреднамеренно или злонамеренно введенная псевдоинформация .

На уровне представления фильтрация информации принимает форму новостных лент на основе предпочтений пользователя и т. Д.

Рекомендательные системы и платформы для обнаружения контента - это активные системы фильтрации информации, которые пытаются представить пользователю элементы информации ( фильмы , телевидение , музыка , книги , новости , веб-страницы ), которые интересуют пользователя. Эти системы добавляют элементы информации к информации, идущей к пользователь, в отличие от удаления элементов информации из информационного потока к пользователю. Рекомендательные системы обычно используют подходы совместной фильтрации или комбинацию подходов совместной фильтрации и фильтрации на основе содержимого, хотя системы рекомендаций на основе содержимого действительно существуют.

История [ править ]

До появления Интернета уже существовало несколько методов фильтрации информации ; например, правительства могут контролировать и ограничивать поток информации в данной стране посредством формальной или неформальной цензуры.

С другой стороны, мы будем говорить о информационных фильтров , если мы ссылаемся на редакторов газет и журналистов , когда они предоставляют услугу , которая выбирает наиболее ценную информацию для своих клиентов, читатели книг, журналов, газет, радио слушателей и зрителей ТВ. Эта операция фильтрации также присутствует в школах и университетах, где существует выборка информации для оказания помощи, основанной на академических критериях, клиентам этой услуги, студентам. С появлением Интернета возможно, что каждый может публиковать все, что пожелает, по невысокой цене. Таким образом, значительно увеличивается менее полезная информация и, следовательно, распространяется качественная информация. Решив эту проблему, компания начала разрабатывать новую фильтрацию, с помощью которой мы можем легко и эффективно получать информацию, необходимую для каждой конкретной темы.

Операция [ править ]

Система фильтрации этого стиля состоит из нескольких инструментов, которые помогают людям находить наиболее ценную информацию, поэтому ограниченное время, которое вы можете посвятить чтению / прослушиванию / просмотру, правильно направляется на наиболее интересные и ценные документы. Эти фильтры также используются для правильной и понятной организации и структурирования информации в дополнение к групповым сообщениям в адресуемой почте. Эти фильтры необходимы для результатов, получаемых поисковыми системами в Интернете. Функции фильтрации улучшаются с каждым днем, чтобы обеспечить загрузку веб-документов и более эффективных сообщений.

Критерий [ править ]

Одним из критериев, используемых на этом этапе, является то , вредно ли знание или нет, позволяет ли знание лучше понять с концепцией или без нее. В этом случае задача фильтрации информации - уменьшить или устранить вредоносную информацию со знанием дела.

Система обучения [ править ]

Система содержания обучения состоит, по общим правилам, в основном из трех основных этапов:

  1. Во-первых, это система, которая предоставляет решения для определенного набора задач.
  2. Впоследствии он проходит критерии оценки, которые будут измерять эффективность предыдущего этапа в отношении решения проблем.
  3. Модуль сбора, на выходе которого получены знания, которые используются в системном решателе первого этапа.

Будущее [ править ]

В настоящее время проблема заключается не в том, как лучше фильтровать информацию , а в том, как эти системы должны самостоятельно изучать информационные потребности пользователей. Не только потому, что они автоматизируют процесс фильтрации, но также создание и адаптацию фильтра. Некоторые отрасли, основанные на нем, такие как статистика, машинное обучение, распознавание образов и интеллектуальный анализ данных, являются основой для разработки информационных фильтров, которые появляются и адаптируются в зависимости от опыта. Чтобы можно было провести процесс обучения, часть информации должна быть предварительно отфильтрована, это означает, что есть положительные и отрицательные примеры, которые мы назвали обучающими данными, которые могут быть сгенерированы экспертами или посредством обратной связи через обычных пользователей.

Ошибка [ редактировать ]

По мере ввода данных система включает новые правила; если мы считаем, что эти данные могут обобщить информацию об обучающих данных, то мы должны оценить развитие системы и измерить способность системы правильно прогнозировать категории новой информации.. Этот шаг упрощается за счет разделения обучающих данных на новую серию, называемую «тестовые данные», которую мы будем использовать для измерения частоты ошибок. Как правило, важно различать типы ошибок (ложноположительные и ложноотрицательные). Например, в случае на агрегаторе контента для детей, он не имеет ту же силу тяжести, чтобы позволить прохождение информации не подходит для них, что показывает насилие или порнография, чем ошибка, чтобы отменить некоторые присвоили информации. Чтобы улучшить систему, снизить частоту ошибок и иметь эти системы с возможностями обучения, подобными человеческим, нам требуется разработка систем, имитирующих когнитивные способности человека, такие как понимание естественного языка, улавливание смысла Общие и другие формы расширенной обработки для достижения семантики информации. .

Сферы использования [ править ]

В настоящее время существует множество методов разработки информационных фильтров, некоторые из них позволяют достичь коэффициента ошибок ниже 10% в различных экспериментах. [ необходима цитата ] Среди этих методов есть деревья решений, опорные векторные машины, нейронные сети, байесовские сети, линейные дискриминанты, логистическая регрессия и т. д. В настоящее время эти методы используются в различных приложениях, не только в веб-контексте, но и по таким разнообразным тематическим вопросам, как распознавание голоса, классификация телескопической астрономии или оценка финансового риска.

См. Также [ править ]

  • Информационная грамотность
  • Фильтр Калмана
  • Пузырь с фильтром
  • Информационный взрыв
  • Информационная перегрузка
  • Информационное общество
  • Искусственный интеллект

Ссылки [ править ]

  • Ханани, У., Шапира, Б., Шовал, П. (2001) Фильтрация информации: Обзор проблем, исследований и систем. Пользовательское моделирование и взаимодействие с пользователем, 11, стр. 203–259.
  • http://www.infoworld.com/d/developer-world/human-information-filter-813

Внешние ссылки [ править ]

  • Инфомир
  • IEEXplore