Предупреждение: вы несете полную ответственность за любые действия, которые вы выполняете с помощью STiki. Вы должны понимать политики Википедии и использовать этот инструмент в рамках этих политик, иначе вы рискуете потерять доступ к инструменту или даже быть заблокированным для редактирования . |
STiki не работает с марта 2020 года. Создатель не может получить доступ к серверам, от которых зависит работа STiki. Пользователям рекомендуется попробовать эти альтернативы . |
STiki с изображением вандализма | |
Разработчики) | Эндрю Дж. Уэст ( west.andrew.g ); Инсуп Ли [1] (советник) |
---|---|
изначальный выпуск | Июнь 2010 г . |
Стабильный выпуск | 2.1 / 8 декабря 2018 г . |
Написано в | Ява |
Платформа | Java SE |
Доступно в | английский |
Тип | Обнаружение вандализма в Википедии |
Лицензия | Стандартная общественная лицензия GNU |
Интернет сайт | andrew-g-west |
STiki - это инструмент, доступный доверенным пользователям, который используется для обнаружения и отмены случаев вандализма , спама и других типов неконструктивных изменений, внесенных в Википедию. STiki выбирает правки для показа конечным пользователям; если отображаемое изменение расценено как вандализм, спам и т. д., STiki оптимизирует процесс возврата и предупреждения. STiki способствует сотрудничеству в борьбе с вандализмом; централизованно хранящиеся списки правок, подлежащих проверке, обслуживаются пользователями STiki, чтобы уменьшить избыточные усилия. STiki - это не бот для Википедии : это интеллектуальный инструмент маршрутизации, который направляет пользователей-людей на потенциальный вандализм для окончательной классификации.
На сегодняшний день STiki был использован для отмены 1 265 447 правок, которые пользователи определили как вандализм, спам или иным образом неконструктивные (см. Таблицу лидеров и основные этапы работы редактора ).
Скачать
- Интерфейсный графический интерфейс , распространяемый в виде исполняемого файла * .JAR . После распаковки дважды щелкните файл * .JAR для запуска (Windows, OS X) или введите команду терминала «java -jar STiki_exec_ [date] .jar» (Unix).
- STiki продолжает активно развиваться как в отношении внешнего графического интерфейса пользователя, так и в отношении внутренних систем оценки. Регулярно проверяйте наличие обновленных версий.
- Разработчики программного обеспечения: исходники STiki @ GitHub .
- Полный исходный код для графического интерфейса и внутреннего сервера. Библиотечные зависимости ( IRC и JDBC ) не включены.
- Также доступны статически: STiki Source (2,0 МБ) --- Компонент обработки ссылок (114 КБ; возможно, код API устарел / не работает).
- Обратите внимание, что он также содержит исходный код инструмента WikiAudit .
Использование STiki
STiki могут использовать только редакторы с учетной записью в Википедии . Кроме того, учетная запись должна соответствовать некоторым требованиям, чтобы снизить вероятность неверного определения пользователями вандализма . Учетная запись должна иметь одно из: (1) разрешение / право на откат , (2) не менее 1000 изменений статьи (в пространстве имен статей , а не на страницах обсуждения / пользователей) или (3) специальное разрешение через страницу обсуждения . Мы подчеркиваем, что пользователи должны нести ответственность за свои действия в STiki.
После входа в систему пользователи в основном взаимодействуют с инструментом GUI , классифицируя правки по одной из четырех категорий:
1. | Вандализм | Если редактирование является явно неконструктивным и преднамеренным по своей злобе, то оно представляет собой вандализм . Нажатие на Vandalismкнопку отменит редактирование, и необходимо поставить отметку в поле «Предупреждать оскорбительного редактора», чтобы виновная сторона была уведомлена о своем нарушении. Несколько предупреждений приведут к отправке отчета на AIV и последующей блокировке. Тем не менее, вы можете избегать использования шаблонов для постоянных клиентов , так как некоторые считают это плохим вики-этикетом. В исключительных случаях маленькую 4imкнопку можно использовать для более серьезного предупреждения. |
2. | Добросовестный возврат | Иногда правки явно неконструктивны, но им не хватает умысла и злого умысла, которые характерны для вандализма. В этих случаях следует проявить добросовестность , отменив изменения с помощью файла Good-faith revert. В этом случае изменение отменяется, но редактору-нарушителю не выдается предупреждение, и откат не помечается как незначительный. Диалог позволяет пользователю STiki уведомить возвращенного пользователя с помощью вежливого и информативного (не «предупреждающего») шаблона сообщения AGF . |
3. | Проходить | Если пользователю STiki неудобно обозначать правку как явный вандализм, он может пропустить Passредактирование. После этого ревизия останется в Википедии и будет показана другому пользователю STiki. Используйте пропуск только в том случае, если вы считаете, что есть некоторая вероятность того, что редактирование является вандализмом, но у вас недостаточно знаний, чтобы принять твердое решение. |
4. | Невиновный | Если редактирование носит преимущественно конструктивный характер, а не вандализм, его следует пометить как Innocent. Это не означает, что редактирование должно быть безупречным. Действительно, STiki ориентирован на антивандальные действия и не может исправить многие проблемы, которые следует решать вне инструмента (используя предоставленные гиперссылки). |
Неопределенность важнее конструктивности: если пользователь не уверен в конструктивности редактирования, самым быстрым решением часто является поиск в Интернете ( например , с помощью Google); это может показать, является ли некий «факт» правдой. Конечно, пользователи STiki должны учитывать надежность найденного источника. Если не удается найти надежный источник, правильным ответом может быть добавление тега {{ Требуется цитирование }} или {{ Проверка достоверности }} с использованием обычного интерфейса вики. Когда контент был удален, здравый смысл обычно является лучшим руководством. Есть ли в удаленном тексте цитаты? (Обратите внимание, что проверка самих цитат может потребоваться в контенте о живых людях..) Что такое сводка редактирования? Имеет ли смысл это объяснение? Обсуждается ли это на странице обсуждения? Независимо от проблемы, все, что требует специальных знаний для решения, вероятно, лучше всего классифицировать как «невиновное» или «пройденное».
Неопределенность по поводу злого умысла : бывает сложно отличить вандализм от добросовестного редактирования, которое, тем не менее, является неконструктивным. Тестовые правки следует классифицировать как «вандализм», поскольку первоначальные предупреждения и комментарии редактирования учитывают этот случай. Если неконструктивное редактирование или сводка редактирования указывают на неопытность Википедии, возможно, лучше всего пометить правку как «добросовестную» и оставить сообщение на странице обсуждения нового пользователя с предложением помощи. Помимо этого, здравый смысл обычно является лучшим руководством. Рассмотрим рассматриваемую статью. Может быть, это то, что может заинтересовать молодых редакторов? Есть ли правда в том, что говорится (отсутствие форматирования, языка и организационных вопросов)?
Более глубокое расследование : Иногда откат («вандализм» или «добросовестность») не устраняет всех проблем, представленных в различии, или различие не содержит достаточно доказательств, чтобы сделать окончательную классификацию. В этих случаях используйте гиперссылки (синий подчеркнутый текст) для открытия соответствующих страниц в веб-браузере по умолчанию. Это полезно, например, для: (1) просмотра страницы обсуждения статьи, чтобы узнать, обсуждалась ли какая-либо проблема, (2) внесения изменений с использованием обычного интерфейса и (3) использования других инструментов, таких как Popups , Twinkle и wikEdDiff .
Когда вы вернетесь к инструменту STiki, вам все равно потребуется классифицировать редактирование. Если вы использовали интерфейс браузера для редактирования статьи, нажатие «вандализма» или «добросовестного возврата» не отменит ваши изменения и не окажет прямого влияния на Википедию. Классифицируйте отображаемую правку как можно лучше. Такая классификация поможет STiki выявлять похожие правки в будущем.
Советы по интерфейсу : в STiki есть горячие клавиши для облегчения взаимодействия пользователя с инструментом. После однократного редактирования классифицирован с помощью мыши (давая панель кнопок «фокус»), ключи V, G, Pи Iбудет отмечать изменения как «вандализм», «добросовестность», «проход», и «невинные» соответственно. В том же режиме клавиши Page Up, Page Down , Up Arrow (↑) и Down Arrow (↓) также будут прокручивать браузер различий. Также обратите внимание, что гиперссылки, которые появляются в различиях, можно открывать в вашем веб-браузере, предполагая, что опция «Активировать Ext-Links» (на вкладке «Опции») включена. STiki хранит ваши настройки в файле с именем.STiki.props.xml
, так что там можно быстро изменить свои настройки.
Сравнение с другими инструментами
Отличительной чертой STiki являются следующие особенности :
1. | Сложные алгоритмы | STiki использует несколько алгоритмов для выявления потенциального вандализма; все основаны на машинном обучении . В настоящее время активные очереди продемонстрировали процент попаданий 25–30% (процент возвратов для всех изменений, отображаемых в графическом интерфейсе пользователя). Случайный поиск даст результат <3%. |
2. | Сервер координирует задачи | Пользователям STiki отображаются правки из централизованно обслуживаемой очереди. Когда пользователю показывают правку, у него есть «резервирование», чтобы другие пользователи STiki не просматривали правку одновременно. Более того, если пользователь помечает правку как «невиновную», никто не будет вынужден просматривать эту правку в будущем. В обоих случаях избегается избыточная работа (конфликты редактирования, многократные проверки хороших правок). |
3. | Сервер помнит | Сервер STiki всегда отслеживает изменения и вычисляет вероятности вандализма, даже если в настоящее время никто не использует инструмент с графическим интерфейсом. Когда конечные пользователи видят правки, это делается исключительно на основании вероятности вандализма, а не на основании того, насколько недавно были внесены изменения. STiki выявил случаи вандализма, происшедшие несколько месяцев назад. |
4. | Простой интерфейс | Интерфейс STiki минимален. Это связано с убеждением, что STiki должен сосредоточиться исключительно на вандализме / удалении спама, а не становиться универсальной структурой для разнообразных неконструктивных изменений. Когда требуется дополнительная информация, интерфейс предоставляет ссылки на соответствующие страницы вики, которые открываются в обычном веб-браузере. |
5. | Кроссплатформенность | STiki, разработанный на Java, является кроссплатформенным . |
Изменить приоритет
STiki приказывает, чтобы изменения отображались конечным пользователям в приоритетных очередях. Приоритет редактирования основан на его оценке системой оценки защиты от повреждений. Различные системы производят разные оценки / очереди, и пользователи могут явно выбрать очередь для доступа с помощью меню «Rev. Queue». Все подходы основаны на машинном обучении , из которых есть два активных и два неактивных подхода:
1. | Cluebot-NG | Использование искусственной нейронной сети (ИНС) для оценки правок - это подход ClueBot NG . Правки, получившие наихудшие оценки, автоматически отменяются. Тем не менее, существует множество правок, которые, по мнению CBNG, являются вандализмом, но не могут быть отменены из-за низкого допуска ложных срабатываний, правила one-revert-rule или других ограничений. Эти оценки получены из канала IRC . | |
2. | STiki (метаданные) | «Исходная» очередь, используемая STiki, с использованием функций метаданных и чередующегося дерева решений для получения прогнозов вандализма. Более подробная информация об этом методе доступна в разделе « Оценка метаданных и их происхождение » ниже. | |
3. | Ссылочный спам | Анализирует новые внешние ссылки из редакций и измеряет их потенциал спама по внешним ссылкам . Вероятности генерируются более чем 50 функциями, захватывающими метаданные Википедии, анализом посадочной площадки и сторонними данными. См. Нашу статью WikiSym'11 . ( Неактивно : редко используется и требует денежных затрат. Может возвращать без платных сторонних функций.) | |
4. | Wikitrust | Система WikiTrust, созданная Адлером и др., Основана на репутации редактора, рассчитанной на основе постоянства содержания . Более подробная информация доступна на их сайте . Оценки WikiTrust используются через их API . ( Неактивно : редко используется, низкая точность и сторонний сервер ненадежен при вычислении вероятностей в реальном времени) |
Когда STiki широко используется, частота актов вандализма, обнаруженных в одной очереди, может значительно снизиться - явление, называемое «исчерпанием очереди». В таких случаях может быть целесообразно попробовать альтернативную очередь. Пользователи также должны осознавать, что количество случаев вандализма в Википедии ограничено. Чем больше людей используют STiki, тем меньший процент увидит любой пользователь. Это не значит, что у STiki «плохо»; это означает, что энциклопедия делает «хорошо».
Оценка и происхождение метаданных
Здесь мы выделяем конкретную систему оценки, основанную на машинном обучении над свойствами метаданных. Эта система была разработана теми же авторами, что и графический интерфейс интерфейса STiki, была единственной системой, поставляемой с первыми версиями, и разделяла кодовую базу / дистрибутив с графическим интерфейсом пользователя STiki. Эта система также дала название всему программному пакету (производное от S патио T emporal processing в W iki pedia), хотя это акронимическое значение сейчас преуменьшено.
«Система метаданных» проверяет только четыре поля редактирования при оценке: (1) отметка времени, (2) редактор, (3) статья и (4) комментарий к редакции. Эти поля используются для расчета характеристик, относящихся к статусу регистрации редактора, редактирования времени суток, редактирования дня недели, географического происхождения , истории страницы, членства в категориях, длины комментария к редакции и т . Д. Эти сигналы передаются классификатору ADTree для определения вероятностей вандализма. Модели машинного обучения обучаются по классификациям, представленным на интерфейсе STiki. Более подробное обсуждение этого метода можно найти в публикации EUROSEC 2010 .
API был разработан, чтобы предоставить другим исследователям / разработчикам доступ к функциям необработанных метаданных и возникающим в результате вероятностям вандализма. README описывает детали API.
Этот документ был академической попыткой показать, что свойства языка не являются необходимыми для обнаружения вандализма в Википедии. В этом отношении он преуспел, но с тех пор система была ослаблена для универсального использования. Например, движок теперь включает в себя несколько простых языковых функций. Более того, было принято решение интегрировать другие системы оценки в интерфейс GUI.
Архитектура
STiki использует архитектуру сервер / клиент :
1. Внутренняя обработка, которая отслеживает все недавние изменения в Википедии и вычисляет / извлекает вероятность того, что каждое из них является вандализмом. Этот механизм вычисляет оценки для системы оценки метаданных и использует API / каналы для получения оценок, рассчитанных сторонними системами. При редактировании заполняется серия взаимосвязанных очередей приоритетов, в которых оценка вандализма является приоритетной. Обслуживание очереди гарантирует, что только самые последние изменения статьи будут доступны для просмотра. Внутренняя работа выполняется на серверах STiki (размещенных в Университете Пенсильвании ), в значительной степени полагаясь на базу данных MySQL .
2. Интерфейсный интерфейс , отображающий различия , которые, по мнению серверной части, вероятно, содержат вандализм, для пользователей-людей и запрашивает окончательную классификацию. Пользовательский интерфейс STiki - это настольное приложение Java . Это упрощает процесс возвращаясь плохие изменения и выдачи предупреждений / ВГП -notices для провинившихся редакторов. Интерфейс разработан для быстрого просмотра. Более того, процесс классификации устанавливает петлю обратной связи для улучшения алгоритмов обнаружения.
Связанная работа и сотрудничество
Авторы STiki стремятся работать над совместными решениями по борьбе с вандализмом. С этой целью для внутренних вычислений STiki доступен API . Прямая трансляция результатов также публикуется на канале "# arm-stiki-scores" на IRC-сервере armstrong.cis.upenn.edu. Более того, весь код STiki имеет открытый исходный код.
В ходе нашего исследования мы собрали большие объемы данных, как пассивно относящихся к Википедии, так и благодаря активному использованию пользователями инструмента STiki. Мы заинтересованы в том, чтобы поделиться этими данными с другими исследователями. Наконец, дистрибутивы STiki содержат программу под названием Offline Review Tool (ORT), которая позволяет быстро просмотреть и аннотировать предоставленный пользователем набор правок. Мы считаем, что этот инструмент окажется полезным для исследователей, занимающихся созданием корпусов.
Кредиты и дополнительная информация
STiki был написан Эндрю Дж. Уэстом ( west.andrew.g ), когда он был докторантом компьютерных наук в Университете Пенсильвании , под руководством Инсупа Ли . Академический документ , который формируется методология Стики была в соавторстве с Сампат Kannan и Insup Ли . Работа частично поддержана ONR -MURI-N00014-07-1-0907.
В дополнение к уже обсуждавшейся академической статье, было несколько описаний / публикаций, посвященных STiki, которые могут оказаться полезными для разработчиков антивандализма. Программное обеспечение STiki было представлено на демонстрации WikiSym 2010 , а плакат WikiSym 2010 визуализирует это содержимое и предоставляет некоторую статистику возврата STiki. STiki также был представлен на Wikimania 2010 со следующими слайдами презентации . В дополнительном документе (не рецензируемом) рассматриваются методы STiki и антивандализма, поскольку они относятся к более широкой проблеме доверия к совместным приложениям. Наконец, экосистема защиты от повреждений и технический вклад STiki были обобщены в докторской диссертации разработчика.. Эта работа является новинкой в анализе ~ 1 миллиона действий классификации STiki, чтобы узнать о человеческих / социальных аспектах процесса патрулирования.
Помимо STiki в отдельности, в статье CICLing 2011 исследуется методика оценки метаданных STiki относительно (и в сочетании с) функций NLP и сохранения контента (два лучших результата конкурса PAN 2010 ) - и в этом процессе устанавливаются новые базовые показатели производительности. Также был проведен конкурс PAN-CLEF 2011 года, который потребовал обработки нескольких естественных языков; запись стики выиграла во всех задачах. В презентации Wikimania 2011 был рассмотрен стремительный прогресс в сфере антивандализма (как в академической среде, так и в вики) за период 2010–2011 годов. Наконец, EDUCAUSE опубликовал исследовательский бюллетень . рассматривает проблему ущерба Википедии / вики с точки зрения организации и высшего образования с особым упором на защиту институционального благополучия.
Запросы, не рассмотренные в этих статьях, следует адресовать авторам STiki.
Ящики для пользователей, награды и разное
Для тех, кто хотел бы продемонстрировать свою поддержку STiki через пользовательский ящик , были созданы / предоставлены следующие возможности:
|
|
| ||||||
|
|
| ||||||
|
|
| ||||||
{{STiki topicon}} |
Другие изображения STiki, реклама, рекламные материалы и статистика:
- Реклама в ротации Википедии :
|
- STiki barnstar, созданный пользователем: Centibyte (обратите внимание также на "веху" STiki barnstars ):
|
- Некоторая статистика о доле рынка STiki
Да Винчи Barnstar | ||
Я был стойким пользователем Huggle около года. Затем, когда я наткнулся на STiki, я обнаружил, что он работает быстрее и намного приятнее в использовании. Считайте меня обращенным. :) Orphan Wiki 15:21, 30 января 2011 г. (UTC) |
Да Винчи Barnstar | ||
В знак признания выдающегося технического достижения. :) œ ™ 23:00, 22 февраля 2011 г. (UTC) |
Антивандализм Barnstar | |
Классный инструмент! Lotje ( разговор ) 06:31, 14 марта 2012 (UTC) |
Технический Barnstar | |
За вашу работу над STiki - спасибо! Алленс ( Обсуждение | вклад ) 10:49, 12 апреля 2012 (UTC) |
Антивандализм Barnstar | |
Это в честь вашей борьбы с вандализмом в Википедии! Аллен (Моррисва) ( разговор ) 00:18, 13 апреля 2012 (UTC) |
Защитник вики Barnstar | |
Это для вашей работы над STiki. Аллен (Моррисва) ( разговор ) 00:19, 13 апреля 2012 (UTC) |
Barnstar графического дизайнера | ||
Для этого замечательного инструмента - потрясающая графика. Пользователь: Deathlaser |
Вот тост за хозяев. За | |
По завершении 100000 отзывов на STiki. Ваше здоровье !!! - Ð ℬig XЯaɣ 20:31, 28 апреля 2012 (UTC) |
Антивандализм Barnstar | |
За ваш вклад в STiki и борьбу с вандализмом в Википедии. Сделаем СТИКИ и Википедию еще лучше! ★ Oliverlyc ★ ✈✈✈ Напишите мне сообщение! 10:46, 13 мая 2012 г. (UTC) |
Неутомимый автор Barnstar | ||
За ваш чудесный вклад и за создание для нас такого чудесного инструмента. Faizan Мунавар Варя говорить 10:01, 21 июня 2012 (UTC) |
Технический Barnstar | |
Самый достойный !!!!! Morning277 ( разговорное ) 15:10, 28 июня 2012 (UTC) |
Платиновый стикер Barnstar of Merit | ||
Поздравляю, STiki! Вы получаете эту награду за заслуги, потому что недавно преодолели порог классификации в 50 000 с помощью STiki . Мы благодарим вас как за ваш вклад в Википедию в целом, так и за использование этого инструмента. Мы надеемся, что вы продолжите свое восхождение в таблице лидеров и останетесь на связи на странице обсуждения . Спасибо и продолжайте в том же духе! West.andrew.g ( разговор ) 03:07, 17 сентября 2012 (UTC) |
Случайные акты доброты Barnstar | |
Спасибо за Bronze STiki Barnstar of Merit! Ваш инструмент действительно очень помогает в этой энциклопедии. Хорошего дня! :) Медиран, поговори со мной! 00:21, 25 ноября 2012 г. (UTC) |
Технический Barnstar | ||
Разработка STiki, одного из самых замечательных инструментов для борьбы с вандализмом в Википедии. _ Это лиса ! (Поговорите со мной?) 03:16, 27 декабря 2012 г. (UTC) |
Оригинальный Barnstar | |
Спасибо за проделанную работу! Я признателен за это. Храп в глазах 19:02, 2 февраля 2013 (UTC) |
Пакистанский Barnstar за заслуги перед национальностью | ||
За ваши неустанные и решительные усилия по созданию Энциклопедии. Спасибо за STiki ! Фай Зан 13:36, 21 мая 2013 (UTC) |
Премия CVU по борьбе с вандализмом | ||
Для создания инструмента, который не только поможет вам предотвратить вандализм, но и позволит другим делать то же самое эффективно и результативно! Джексон Пиблз ( разговор ) 06:30, 25 мая 2013 (UTC) |
Зал славы антивандализма | |
Поздравляю! За создание STiki я награждаю вас местом в AV HOF. Пользователь: Buffbills7701 / Зал славы антивандализма положительные счета 7701 15:50, 30 июля 2013 г. (UTC) |
Барнстар честности | ||
STiki искореняет правки ИСП, а также вандализм, и является выдающимся оружием против эгоистичных интересов, эксплуатирующих Википедию. Coretheapple ( разговор ) 18:06, 16 ноября 2013 (UTC) |
Блестящая идея Barnstar | |
За все ваши яркие идеи в STIKI! - Кейтбоб • Обсуждение • 21:17, 9 декабря 2013 г. (UTC) |
Антивандализм Barnstar | |
Очень хорошая программа для борьбы с вандализмом! TheEpTic ( разговор ) 15:51, 16 декабря 2013 (UTC) |
Антивандализм Barnstar | ||
Умное использование данных ClueBot NG для фильтрации вандализма; намного эффективнее, чем функция редактирования с фильтрами в Huggle . Esquivalience t 02:59, 1 мая 2015 г. (UTC) |
Оригинальный Barnstar | |
STiki - лучший инструмент борьбы с вандализмом на Вики, и я ценю все, что вы делаете для борьбы с вандализмом. Спасибо, что сделали Википедию лучше! - Liance ток / вклад 4:02, 4 декабря 2015 (UTC) |
STiki Barnstar | ||
Вы первый, кто получит эту звезду; Вы, несомненно, заслужили эту честь, потому что изначально создали STiki. Centibyte (разговор) 14:18, 28 марта 2018 (UTC) |
Антивандализм Barnstar | |
STiki позволил мне обнаружить вандализм, возникший несколько месяцев назад, который, вероятно, оставался бы в сети гораздо дольше, если бы не был в очереди. Спасибо за создание этого замечательного инструмента! EclipseDude ( разговор ) 08:34, 2 сентября 2018 (UTC) |
Технический Barnstar | |
Это для вашего усердного труда над улучшением Википедии с помощью технических работ, особенно разработки мощного средства защиты от вандализма STiki. Спасибо. PA TH SL OP U 09:30, 3 июня 2019 г. (UTC) |