Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Wordfilter (иногда называют просто « фильтр » или « цензором ») является сценарий , как правило , используется на интернет - форумах или чатах , которые автоматически сканирует сообщения или комментарии пользователей , поскольку они представляются и автоматически изменяет или цензоры конкретные слова или фразы.

Самые простые фильтры слов ищут только определенные строки букв и удаляют или перезаписывают их независимо от их контекста. Более продвинутые фильтры слов делают некоторые исключения для контекста (например, фильтруют «стык», но не «масло»), а самые продвинутые фильтры слов могут использовать регулярные выражения .

Функции [ править ]

Wordfilters могут выполнять любую из множества функций.

Удаление вульгарной лексики [ править ]

Поклясться фильтр , также известный как ненормативной лексики фильтр или языковой фильтр представляет собой программное обеспечение подсистема , которая модифицирует текст для удаления слов , считающихся оскорбительными администратором или сообщества на интернет - форуме . Фильтры ругательства распространены в настраиваемых чатах и онлайн-видеоиграх , прежде всего в MMORPG . Это не следует путать с фильтрацией содержимого , которая обычно встроена в программы просмотра Интернета сторонними разработчиками для фильтрации или блокировки определенных веб-сайтов или типов веб-сайтов. Фильтры ругательства обычно создаются или реализуются разработчиками интернет-сервиса.

Чаще всего фильтры слов используются для цензуры языка, который операторы форума или чата считают неприемлемым. Ругательства обычно частично заменяются, полностью заменяются или заменяются бессмысленными словами. [1] Это освобождает администраторов или модераторов от необходимости постоянно патрулировать доску в поисках такой лексики. Это также может помочь доске объявлений избежать использования программного обеспечения для управления контентом, установленного на компьютерах или в сетях пользователей, поскольку такое программное обеспечение часто блокирует доступ к веб-страницам, содержащим вульгарную лексику.

Отфильтрованные фразы могут быть навсегда заменены при сохранении (пример: phpBB 1.x), или исходная фраза может быть сохранена, но отображаться как цензурированный текст. В некоторых программах пользователи могут просматривать текст за фильтром слов, цитируя сообщение.

Фильтры ругательства обычно используют функции замены строк, встроенные в язык программирования, используемый для создания программы, для замены списка неподходящих слов и фраз множеством альтернатив. Альтернативы могут включать:

  • бессмысленные символы grawlix , например! @ # $% ^ & *
  • Замена определенной буквы символом числа смены или похожим на нее.
  • Звездочки (* или #) либо заданной длины, либо длины исходного фильтруемого слова. Кроме того, в плакатах некоторые буквы часто заменяются звездочкой.
  • Нарезанные клятвы, такие как «черт возьми» или «черт», или придуманные слова, такие как «flum».
  • Семейные слова или фразы, или эвфемизмы, такие как «ЛЮБОВЬ» или «Я ЛЮБЛЮ ТЕБЯ», или совершенно другие слова, не имеющие ничего общего с исходным словом.
  • Удаление сообщения. В этом случае блокируется вся публикация и обычно нет возможности исправить это.
  • Вообще ничего. В этом случае оскорбительное слово удаляется.

Некоторые фильтры ругательства выполняют простой поиск строки. У других есть меры, которые игнорируют пробелы , а третьи доходят до игнорирования всех не буквенно-цифровых символов с последующей фильтрацией простого текста. Это означает, что если слово «you» было настроено для фильтрации, «yo u» или «yo! U» также будут отфильтрованы.

Управление клише [ править ]

На форумах часто появляются клише - определенные слова или фразы, которые постоянно используются в сообщениях, также известные как «мемы». Некоторые пользователи считают, что эти клише добавляют удовольствия, но другие находят их утомительными, особенно при чрезмерном использовании. Администраторы могут настроить фильтр слов, чтобы заменить назойливое клише более смущающей фразой или полностью удалить его.

Борьба с вандализмом [ править ]

Интернет-форумы иногда подвергаются нападениям со стороны вандалов, которые пытаются заполнить форум повторяющимися бессмысленными сообщениями, или со стороны спамеров, которые пытаются вставить ссылки на свои коммерческие веб-сайты. Фильтр слов сайта может быть настроен для удаления бессмысленного текста, используемого вандалами, или для удаления всех ссылок на определенные веб-сайты из сообщений.

Фильтр хромоты [ править ]

Фильтры хромоты - это текстовые фильтры слов, используемые веб-сайтами, основанными на слэшах (т. Е. Текстовыми досками и имиджбордами ), для предотвращения публикации нежелательных комментариев в ответ на статьи. Вот некоторые из вещей, которые они предназначены для фильтрации:

  • Слишком много заглавных букв
  • Слишком много повторений
  • ASCII искусство
  • Слишком короткие или длинные комментарии
  • Использование HTML-тегов, которые пытаются сломать веб-страницы
  • Заголовки комментариев, состоящие исключительно из "первого сообщения"
  • Любое появление слова или термина, которое программисты сочтут оскорбительным или вульгарным.

Обход фильтров [ править ]

Поскольку фильтры слов автоматизированы и ищут только определенные последовательности символов , пользователи, осведомленные о фильтрах, иногда пытаются обойти их, изменяя свои буквы ровно настолько, чтобы избежать фильтров. Пользователь, пытающийся избежать фильтра вульгарности, может заменить один из символов в оскорбительном слове звездочкой, тире или чем-то подобным. Некоторые администраторы в ответ изменяют фильтры слов, чтобы уловить распространенные замены; другие могут квалифицировать уклонение от фильтрации как собственное наказуемое нарушение. [2] Простым примером обхода фильтра слов может быть ввод символов между буквами или использование leet . Более продвинутые методы обхода фильтра слов включают использование изображений, использование скрытых тегов или кириллических символов.(то есть атака спуфинга омографа ).

Другой способ - использовать мягкий дефис . Мягкий дефис используется только для обозначения того, где слово может быть разделено при разрыве текстовых строк, и не отображается. Помещая это наполовину в слове, слово разбивается и в некоторых случаях не распознается фильтром слов.

Некоторые более продвинутые фильтры, например, в онлайн-игре RuneScape , могут обнаруживать обход. Однако обратная сторона чувствительных текстовых фильтров заключается в том, что отфильтровываются и правильные фразы.

Аспекты цензуры [ править ]

Wordfilters закодированы в интернет-форумах или чатах и ​​работают только с материалами, отправленными на рассматриваемый форум или чат. Это отличает фильтры слов от программного обеспечения для управления контентом , которое обычно устанавливается на ПК конечного пользователя или в компьютерной сети и которое может фильтровать весь Интернет-контент, отправляемый на или с данного ПК или сети. Поскольку фильтры слов изменяют слова пользователя без его согласия, некоторые пользователи по-прежнему считают их цензурой , в то время как другие считают их приемлемой частью права оператора форума контролировать содержание форума.

Ложные срабатывания [ править ]

Распространенная причуда с фильтрами слов, которую пользователи часто считают смешной или раздражающей, заключается в том, что они часто влияют на слова, которые не предназначены для фильтрации. Это типичная проблема при фильтрации коротких слов. Например, можно увидеть: «Вам нужен танец для исполнения классической музыки?» Несколько слов могут быть отфильтрованы, если пробелы игнорируются, в результате чего «как подозреваемые» становятся «ожидаемыми». Запрещение фразы, такой как «жестко», приведет к отфильтровыванию безобидных высказываний, таких как «Это было сложно!» и "Прости, что я был к тебе строг", на "Это было а!" и «Прости, что я был тобой».

Некоторые слова, которые были случайно отфильтрованы, могут стать заменой нецензурным словам. Один из примеров этого можно найти на форуме Myst Mystcommunity. Там слово «рукопись» было случайно подвергнуто цензуре за то, что оно содержало слово «анус», что привело к появлению «m **** cript». Слово было принято в качестве замены ругательства и перенесено при перемещении форума, и многие заменители, такие как «сценарии», используются (хотя в основном старыми членами сообщества).

Названия мест могут быть непреднамеренно отфильтрованы из-за того, что они содержат части нецензурной лексики. В первые годы существования Интернета британское географическое название Penistone часто исключали из фильтров спама и ругательств. [3]

Реализация [ править ]

Многие игры, такие как World of Warcraft , а в последнее время Habbo Hotel и RuneScape, позволяют пользователю отключать фильтры. Другие игры, особенно бесплатные многопользовательские онлайн-игры , такие как Knight Online , не имеют такой возможности.

Другие игры, такие как Medal of Honor и Call of Duty (кроме Call of Duty: World at War , Call of Duty: Black Ops , Call of Duty: Black Ops 2 и Call of Duty: Black Ops 3 ), не предоставляют пользователям возможность отключить нецензурную лексику по сценарию, в то время как Gears of War это делает.

Помимо игр, фильтры ненормативной лексики можно использовать для модерации пользовательского контента на форумах, блогах, в приложениях социальных сетей, детских сайтах и ​​обзорах продуктов. Существует множество API-интерфейсов фильтров ненормативной лексики [4], таких как WebPurify, которые помогают заменять нецензурные слова другими символами (например, «@ # $!»). Эти API-интерфейсы фильтров нецензурной лексики работают с методом поиска и замены ненормативной лексики.

См. Также [ править ]

  • Цензура со стороны Google § Поисковые подсказки
  • Программное обеспечение для управления контентом
  • Интернет-цензура
  • Проблема Сканторпа

Ссылки [ править ]

  1. ^ "Когда, черт возьми, мы получили фильтр слов?" . Проверено 1 октября 2006 .
  2. ^ «Условия использования GameFAQs» . GameFAQs . Проверено 4 августа 2008 .
  3. ^ Ширин, Jude (29 марта 2010). «Как спам-фильтры продиктовали судьбу канадского журнала» . BBC Online . Проверено 5 апреля 2011 года .

Внешние ссылки [ править ]

  • Online Text Obfuscator - заменяет символы схожими символами Unicode из разных наборов символов (например, кириллицы)
  • Текстовый фильтр - Текстовые инструменты онлайн: сортировка по алфавиту, удаление дубликатов, удаление всех не буквенно-цифровых символов, только цифр, букв и т. Д.

заменяет символы аналогичными символами Unicode из разных наборов символов (например, кириллица)