Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

COIBot - это бот, который пытается отслеживать изменения, внесенные пользователями, у которых может быть конфликт интересов («COI», см. Википедия: Конфликт интересов , m: Условия использования , Википедия: Спам и Википедия: Рекомендации для редакторов с близкие ассоциации ).

COIBot пытается связать имя пользователя (или IP-адрес) с материалом, который они редактируют:

  • Имя пользователя похоже на имя страницы, которую пользователь редактирует.
  • Имя пользователя похоже на внешние ссылки, которые пользователь добавляет
  • user-IP (в случае IP-пользователей) в непосредственной близости от IP-адреса домена (внешняя ссылка), добавляемого пользователем (IP-адрес домена, сообщенный во время добавления DNS-сервером).

Более того, COIBot будет отслеживать изменения, которые ему было поручено следовать (например, определенные шаблоны имени пользователя или шаблоны внешних ссылок).

COIBot также тесно сотрудничает с LiWa3 , ботом вне вики, который отслеживает все добавления ссылок (в областях содержимого Википедии) по всей WikiMedia (~ 830 вики). LiWa3 обнаружит ссылки, которые добавлены только IP-адресами, добавлены только одним пользователем, которые являются сайтами перенаправления или которые были отправлены на одну из досок объявлений, связанных со спамом, и сообщит о них в COIBot.

COIBot имеет доступ к базе данных добавленных ссылок, созданной LiWa3, и может сохранять отчеты по данным, полученным из этой базы данных:

  • Сообщает обо всех добавлениях внешних ссылок:
    • на определенном домене;
    • на доменах, размещенных на одном IP-адресе сервера (IP-адрес сервера, сообщаемый DNS-сервером во время добавления).
  • Отчеты обо всех правках конкретного пользователя / IP-редактора:
    • все добавления ссылок, которые были выполнены определенным пользователем / IP (например, сбор всех доменов, спамленных определенным спамером);
    • сообщать обо всех изменениях, когда COIBot обнаружил значительную связь между именем пользователя / IP-адресом пользователя и отредактированной страницей / добавленным доменом.

Что смотрят

COIBot в настоящий момент слушает и отчитывается по каналам IRC ( IRC на freenode.net ):

  • # wikipedia-en-spam - все отчеты о добавлении ссылок и ссылок (здесь читается англоязычный фид добавления ссылок)
  • # wikimedia-swmt - все отчеты не на английском языке.
  • # wikimedia-swmt-spam - все отчеты о добавлении ссылок и coi, не относящиеся к en.wikipedia (здесь читается фид добавления ссылок на неанглийском языке).
  • # wikipedia-spam-t - основной командный канал, определенные специальные отчеты
  • # wikipedia-spam-stats - используется для статистики и команд

В IRC на wikimedia.org COIBot стандартно слушает ~ 830 вики.

COIBot здесь следит за редактированием страниц. Каналы можно добавлять или удалять во время работы COIBot.

О чем сообщается и где

Все правки, относящиеся к этой википедии, сообщаются здесь , обо всем сообщается в учетной записи COIBot на meta.wikipedia.org . Отчеты о конкретных пользователях и ссылках сохраняются как в википедии, так и в обоих случаях содержат все отчеты.

Белый список

Элементы в белом списке заставляют COIBot игнорировать полное редактирование, поэтому, когда ссылка 'example' <-> 'example.com' будет в белом списке, COIBot не будет сообщать, когда пользователь 'example' добавит 'example.com' в страница (что обычно приводит к перекрытию на 70%, что значительно превышает пороговое значение). Пользователи также могут быть полностью внесены в белый список, в результате чего о них никогда не будет сообщено. Полный белый список ссылок по-прежнему приведет к тому, что о них будет сообщено, но такие ссылки никогда не будут подвергаться автоматическому мониторингу (см. Список мониторинга ниже).

Пожалуйста, поймите, что белый список означает, что ваше имя пользователя занесено в белый список всех отслеживаемых вики, что также означает, что, хотя у вас нет конфликта интересов в этой вики, другой пользователь другой вики может иметь конфликт интересов. Поэтому может быть нежелательно заносить определенные имена пользователей в белый список.


Если вы считаете, что ваше имя ошибочно указано в отчете, пожалуйста, а) удалите себя из отчетов (желательно с помощью тегов <s> и </s>, предоставив четкое резюме редактирования, и сообщите Дирку Битстра или постоянному посетителю в Википедии: WikiProject Spam для запроса внесения в белый список. Обратите внимание, что отчеты по ссылкамВикипедии: WikiProject Spam / LinkReports ) генерируются COIBot автоматически и могут быть повторно созданы перед внесением в белый список.

Черный список

В Coibot есть таблица, в которой имена пользователей связаны с ключевыми словами. Это дает возможность проверить, добавляют ли определенные учетные записи, например, определенный URL-адрес (при наличии подозреваемого или известного конфликта интересов). Например, правило черного списка «COIBot» <-> «example» приведет к следующим двум результатам, если пользователь COIBot добавит ссылку «www.example.com»:

Во втором случае коэффициент выше порогового значения, и будет сообщено о COIBot.

Также проверяется обратное, поэтому example.com можно связать с ключевым словом COI или с IP-диапазонами, что позволяет находить sock-марионетки или проверять наличие добавлений по определенным диапазонам IP.

Список мониторов

COIBot записывает добавления URL-адресов в список мониторинга, за исключением случаев, когда пользователь внесен в белый список или когда пользователь уже зарегистрирован через черный список или через перекрытие между именем пользователя и именем домена. Эта функция используется для поиска диапазонов IP-адресов или учетных записей sock-марионеток, которые добавляют определенные домены, но где полный объем задействованных учетных записей (пока) не ясен. Эта функция может приводить к многочисленным «ложным срабатываниям» для доменов, которые, помимо рассылки спама или подталкивания определенных учетных записей, также используются, например, в качестве ссылок.

Добавление ссылки, которая имеет большое совпадение с именем пользователя, добавляющего ссылку, приведет к автоматическому добавлению ссылки в список мониторинга. COIBot также отслеживает WT: WPSPAM , WT: SBL и WP: COIN на предмет зарегистрированных ссылок, а также черные списки спама в википедии, которую он отслеживает.

Все элементы в списке монитора интерпретируются как регулярное выражение .

Когда ваше имя появляется в отчетах по отслеживаемой ссылке, это не означает, что у вас есть конфликт интересов или что вы рассылали спам, но это может (иметь) (en) проблемы с этой конкретной ссылкой или что есть случайное перекрытие (см. # Белый список ). Дополнительную информацию (причины мониторинга или занесения в черный список) можно найти в заголовке конкретных отчетов по этой ссылке (см. Википедия: WikiProject Spam / LinkReports, где приведен список сгенерированных отчетов по ссылкам ).

Отчеты

  • Википедия: WikiProject Spam / COIReports - отчеты о предполагаемых случаях конфликта интересов
  • Википедия: WikiProject Spam / LinkReports - отчеты о подозрительных ссылках (также обновляются автоматически).
  • Википедия: WikiProject Spam / UserReports - отчеты о подозреваемых пользователях.
  • Википедия: WikiProject Spam / PageReports - отчеты о подозрительных страницах.

Интерпретация

Следует проявлять осторожность при интерпретации данных, предоставляемых COIBot. У бота есть механизм, который сопоставляет имя пользователя с добавленным доменом или отредактированной страницей, сообщая о значительном перекрытии (его стандартная настройка - сообщать обо всех случаях с перекрытием более 25%). В текущем состоянии из отчетов видно, что более 95% зарегистрированных случаев являются «правильными» с точки зрения «имя пользователя действительно имеет огромное совпадение с именем страницы / URL-адресом».

Некоторые моменты внимания:

1. Редакторы с короткими именами пользователей, редактирующие статьи с короткими именами, легко превышают 25% -ный порог, поскольку отдельные символы имеют большой вес в коротких именах:

<COIBot> ТЕСТ: en: Пользователь: zxv / en: Special: Contributions / zxv набирает 90% (U-> T) и 60% (TU) (соотношение 54%) на строке zyxwv

2. Частичное совпадение не обязательно означает, что у редактора есть конфликт интересов. Пример:

<COIBot> ТЕСТ: en: Пользователь: chocolatefan / en: Special: Вклады / chocolatefan набирает 75% (U-> T) и 47,36% (TU) (соотношение 35,52%) в строке chocolate_chip_cookie
Конечно, у ChocolateFan нет конфликта интересов при добавлении важной информации к шоколадному печенью .

Следовательно, все результаты должны проверяться и будут проверяться вручную на соответствие политикам и рекомендациям. Если неправильные отчеты появляются слишком часто, эти комбинации могут быть внесены в белый список.

Программное обеспечение

Бот написан на Perl , первоначально на основе кода user: shadowbot (хотя перекрытие теперь является только базовым механизмом чтения IRC и редактирования mediawiki). Он использует perlwikipedia, модуль для чтения / записи страниц mediawiki. Последний пример кода можно найти на m: User: COIBot / COIBot .

Barnstars