Из - за технических трудностей, Wikimedia «s внутренняя статистика для английской Википедии не были собраны с октября 2006 года для того , чтобы частично восполнить этот пробел, я составил независимый анализ , основанный на лог - файлов Википедии и загрузки редактировать истории для значительной доли статей Википедии (118793 статьи, ~ 6% всех статей).
Результаты этого анализа кратко изложены ниже. Самым удивительным результатом является то, что активность сообщества Википедии, похоже, снижается в течение последних шести месяцев. Там, где это уместно, я масштабировал количество статей, чтобы показать, чего можно ожидать от полных 2 миллионов статей в Википедии. Полет драконов 22:07, 9 октября 2007 г. (UTC)
Изменить курс
Скорость внесения правок в статьи Википедии, похоже, достигла пика в феврале-апреле 2007 года и с тех пор снизилась. Это снижение беспрецедентно в истории Википедии, которая на протяжении большей части своей истории отмечена почти экспоненциальным ростом. Как обсуждается ниже, некоторые другие статистические данные показывают снижение, начинающееся примерно в тот же период. Хотя это может быть чисто случайным совпадением, эти временные рамки также соответствуют дискуссии об Essjay, появившейся в прессе.
Кроме того, мы отмечаем, что незарегистрированные редакторы, то есть редакторы, идентифицируемые только по IP-адресу, по-прежнему составляют примерно треть всех правок, вносимых в статьи.
Кратковременное резкое падение в конце 2006 года связано с рядом аппаратных проблем, которые повлияли на доступность Википедии.
Количество правок в статье
В настоящее время в средней статье Википедии всего 16 правок, при этом 30% статей имеют менее 10 правок. Только около 9% статей содержат более 100 правок и 0,5% статей - более 1000 правок.
По техническим причинам в этот образец не включены статьи, созданные в течение трехнедельного периода в сентябре 2007 года, и, следовательно, среднее количество правок на статью несколько завышено.
Скорость возврата
Возврат , то есть правки, которые отменяют правки других пользователей, - обычная часть процесса редактирования Википедии. Я попытался идентифицировать реверты на основе общих ключевых слов, обычно используемых для их идентификации в сводках редактирования, например, «откат», «rv», «undid», «вандализм» и т. Д. Кроме того, я предположил, что непосредственно предыдущее изменение было тот, который был отменен. Используя эти приближения, кажется, что большая часть возвращенного контента поступает от незарегистрированных редакторов, идентифицируемых только по IP-адресу, и, кроме того, администраторы тратили гораздо больше времени на откаты, чем другие группы. Тем не менее, участие незарегистрированных редакторов по-прежнему составляет значительную часть обычных правок, вносимых в статьи, а зарегистрированные пользователи, не являющиеся администраторами, вместе выпускают примерно в три раза больше откатов, чем администраторы.
Частота возврата / возврата содержимого, по-видимому, увеличивается со временем, и в последнее время примерно 20% всех правок статей являются либо возвратами, либо изменениями, которые были отменены. Существует также заметная сезонность с меньшим количеством возвратов в течение лета в Северном полушарии , что, возможно, указывает на связь с учебным годом .
Обратите внимание, что возврат может включать в себя как вандализм, так и споры по поводу содержания , поэтому коэффициент возврата не обязательно означает простой коэффициент вандализма. Возможно, например, что частота споров о содержании увеличивается независимо от изменений в вандализме.
Новые статьи, новые пользователи, новые администраторы
В начале 2006 года создание статей приостановилось после того, как незарегистрированным пользователям было запрещено создавать новые статьи после разногласий с компанией Seigenthaler , но общий показатель заметно не снизился.
Как и общая скорость редактирования, скорость создания новых учетных записей достигла пика в начале 2007 года и с тех пор снизилась примерно на 30%.
Самый большой период для создания новых администраторов пришелся на конец 2005 года и оставался относительно стабильным с середины 2006 года.
Загрузки и действия администратора
Количество удалений, блокировок, защиты и загрузки статей за последние месяцы снизилось. Однако количество удалений изображений увеличилось в результате недавних усилий по более строгому соблюдению критериев несвободного контента .
Записи административных действий частично сбиваются с толку действиями секретных ботов-администраторов, которые выполнялись Curps ( частичное описание бота ), Betacommand , Misza13 ( частичное описание бота ) и другими.
Дата файлы
Следующие страницы содержат большую часть данных, используемых при создании изображения, показанного выше, а также дополнительные данные, извлеченные из файлов журнала Википедии.
- Статистические данные получены из выборки 118000 статей.
- Статистика, полученная из файлов журнала Википедии