Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

С тех пор, как Википедии исполнилось несколько лет, в рецензируемых публикациях проводились многочисленные академические исследования о Википедии . Это исследование можно разделить на две категории. Первый анализировал производство и надежность содержания энциклопедии, а второй исследовал социальные аспекты, такие как использование и администрирование. Таким исследованиям в значительной степени способствует тот факт, что базу данных Википедии можно загрузить без помощи владельца сайта. [1]

Содержание [ править ]

Производство [ править ]

Меньшинство редакторов создают большую часть постоянного контента [ править ]

В рецензируемой работе знаковое, [2] также упоминается в The Guardian , [3] группа из шести исследователей из Университета Миннесоты измерили соотношение между COUNT редактирования и редакторов редакторов умение передать свои труды читателей Википедии , измеряемый в терминах постоянных просмотров слов (PWV) - количество просмотров слова, введенного при редактировании. Метод учета лучше всего описать словами самого автора: «каждый раз, когда просматривается статья, также просматривается каждое из ее слов. Когда просматривается слово, написанное редактором X, ему или ей засчитывается один PWV». Количество просмотров статьи оценивалось по журналам веб-сервера.

Исследователи проанализировали 25 триллионов PWV, связанных с зарегистрированными пользователями в период с 1 сентября 2002 г. по 31 октября 2006 г. В конце этого периода 10% лучших редакторов (по количеству правок) имели 86% PWV, т.е. 1% около 70%, а 0,1% (4200 пользователей) - 44% PWV, то есть почти половина «ценности» Википедии, измеренной в этом исследовании. Десять лучших редакторов (по PWV) внесли только 2,6% PWV, и только трое из них попали в топ-50 по количеству редактирования. На основании полученных данных авторы исследования вывели следующую взаимосвязь:

Рост доли PWV увеличивается сверхэкспоненциально с увеличением рейтинга количества редактирований; Другими словами, элитные редакторы (те, кто редактирует больше всего) приносят больше пользы, чем они [были бы приписаны] с учетом степенного отношения.

В исследовании также анализировалось влияние ботов на контент. По количеству правок боты доминируют над Википедией; 9 из 10 лучших и 20 из 50 - это боты. Напротив, в рейтинге PWV только два бота входят в топ-50, и ни один из них не входит в топ-10.

Основываясь на неуклонном росте влияния PWV на этих 0,1% ведущих редакторов, исследование однозначно пришло к выводу:

... Частые редакторы доминируют над тем, что люди видят, когда они посещают Википедию, и ... это доминирование усиливается.

Распределение работы и социальные слои [ править ]

В рецензируемой статье отмечалось « социальное расслоение в обществе Википедии» из-за «класса админов». В документе предполагалось, что такое расслоение может быть полезным в некоторых отношениях, но признавалось «явное последующее изменение власти между уровнями расслоения» из-за «разницы в статусе и полномочиях» между администраторами и другими редакторами. [4]

Анализируя всю историю редактирования английской Википедии до июля 2006 г., в том же исследовании было установлено, что влияние правок администратора на содержание неуклонно снижалось с 2003 г., когда администраторы выполняли примерно 50% всех правок, до 2006 г., когда редактировалось только 10% правок. были выполнены администраторами. Это произошло несмотря натот факт, что среднее количество правок на одного администратора увеличилось более чем в пять раз за тот же период. Авторы статьи назвали это явление «подъемом толпы». Анализ, который использовал в качестве метрики количество отредактированных слов вместо количества действий редактирования, показал аналогичную картину. Поскольку класс администратора является несколько произвольным в отношении количества правок, в исследовании также учитывалась разбивка пользователей по категориям в зависимости от количества выполненных правок. Результаты для «элитных пользователей», то есть пользователей с более чем 10 000 правок, были в некоторой степени совпадающими с результатами, полученными для администраторов, за исключением того, что «количество слов, измененных элитными пользователями, соответствовало изменениям, внесенным начинающими пользователями,

Таким образом, хотя их влияние, возможно, ослабло в последние годы, элитные пользователи, похоже, продолжают вносить значительную часть работы, выполняемой в Википедии. Более того, ... правки, внесенные элитными пользователями, кажутся существенными по своему характеру. То есть, похоже, они делают больше, чем просто исправляют орфографические ошибки или переформатируют цитаты ...

Надежность [ править ]

В документе конференции Argumentation (2010) оценивается, основано ли доверие к Википедии на эпистемических или прагматических достоинствах. Хотя читатели могут не оценить фактические знания и опыт авторов данной статьи, они могут оценить страсть участников к проекту и коммуникативный дизайн, с помощью которого проявляется эта страсть, и дать повод для доверия. [5]

В деталях автор утверждал, что Википедии нельзя доверять, основываясь на индивидуальном опыте, коллективных знаниях или прошлом опыте надежности. Это связано с тем, что анонимность и псевдонимность препятствуют оценке знаний, а « антиэкспертная культура » делает маловероятным, что это изменится. Редактирование Википедии может в значительной степени ограничиваться элитной группой редакторов, без агрегирования « мудрости толпы », что в некоторых случаях в любом случае снижает качество статьи. Личный опыт и эмпирические исследования, подтвержденные инцидентами, включая противоречие биографии Зайгенталера , указывают на вывод о том, что Википедия в целом ненадежна. Следовательно, эти эпистемологические факторы не оправдывают консультации с Википедией.

Затем автор предложил обоснование доверия Википедии, основанное на прагматических ценностях, которые можно условно разделить на два фактора. Во-первых, размер и активность вокруг Википедии указывают на то, что редакторы глубоко привержены делу предоставления миру знаний. Во-вторых, прозрачное развитие политик, практик, институтов и технологий в дополнение к заметным массированным усилиям устраняет возможные опасения, которые могут возникнуть в связи с доверием Википедии. Поднятые опасения включают определение предоставленных знаний, предотвращение искажения вкладов людей, не разделяющих одни и те же обязательства, исправление ошибок редактирования, а также контроль и улучшение качества статей.

География [ править ]

Исследование, проведенное Оксфордским институтом Интернета, показало, что по состоянию на 2009 год статьи Википедии с " геотегами " во всех языковых изданиях охватывали около полумиллиона мест на Земле. Однако географическое распределение статей было крайне неравномерным. Большинство статей написано о Северной Америке, Европе и Восточной Азии, при этом очень мало освещаются большие части развивающегося мира, включая большую часть Африки. [6]

Обработка естественного языка [ править ]

Текстовое содержание и структурированная иерархия Википедии стали важным источником знаний для исследователей в области обработки естественного языка и искусственного интеллекта . В 2007 году исследователи из Техниона - Израильского технологического института разработали метод, названный явным семантическим анализом [7], который использует мировые знания, содержащиеся в англоязычных статьях Википедии. Концептуальные представления слов и текстов создаются автоматически и используются для вычисления сходства между словами и между текстами.

Исследователи Ubiquitous Knowledge Processing Lab используют лингвистические и мировые знания, закодированные в Википедии и Викисловаре, для автоматического создания лингвистических баз знаний, которые похожи на созданные экспертами ресурсы, такие как WordNet . [8] Штрубе и Понцетто создали алгоритм для определения отношений между словами, просматривая английскую Википедию с помощью схемы категоризации, и пришли к выводу, что Википедия создала «таксономию, способную конкурировать с WordNet в задачах лингвистической обработки». [9]

Критика полей содержания [ править ]

Информация о здоровье [ править ]

Информация о здоровье в английской Википедии обычно доступна в виде результатов из поисковых систем и на странице результатов поисковой системы , которые часто содержат ссылки на статьи Википедии. [10] Были проведены независимые оценки качества медицинской информации, представленной в Википедии, и того, кто имеет доступ к этой информации. Были изучены количество и демографические данные людей, которые ищут информацию о здоровье в Википедии, объем информации о здоровье в Википедии и качество информации в Википедии. [11] Есть недостатки в использовании Википедии в качестве источника информации о здоровье. [ требуется дальнейшее объяснение ]

Социальные аспекты [ править ]

Демография [ править ]

Исследование, проведенное Hitwise в 2007 году и опубликованное в журнале Time [12], показало, что посетители Википедии почти поровну: 50/50 мужчин и женщин, но 60% редакторов вносятся редакторами-мужчинами.

WikiWarMonitor , которая является частью Европейской комиссии , КОРДИС FP7 FET-Open поддерживается проект под названием ICTeCollective, опубликовано:

В 2011 году в IEEE Xplore под названием «Изменить войны в Википедии» для IEEE - й Международной конференции по социальным вычислениям (SocialCom), он сообщил новый способ оценить , насколько спорной статьи Википедии, и проверены на 6 языков индоевропейской изданий , включая английский язык . [13]

В 2012 году в PLoS ONE, который использовал совокупные данные из 32 языковых изданий Википедии, он сообщил, что на основе анализа паттернов циркадной активности доли вкладов в английскую Википедию из Северной Америки и Европы-Дальнего Востока-Австралии почти равны, тогда как это увеличивается до 75% вкладов Европы, Дальнего Востока и Австралии в Simple English Wikipedia . В исследовании также содержится другой демографический анализ других изданий на разных языках. [14]

В 2013 году в Physical Review Letters , , Письмо сообщили общую социальную динамику модели в среде совместной работы с участием мнений, конфликты и консенсуса, с определенным аналог Википедии: «мирная статья может внезапно стать спорным , когда все больше людей участвовать в редактировании . " [15]

В 2014 году опубликована в виде книги глава под названием «Самые противоречивые темы в Википедии: многоязычный и географический анализ»: проанализирован объем редактирования статей в разных языковых версиях Википедии с целью определения наиболее спорных тем на разных языках и в разных группах. языков. В английской версии в тройку самых спорных статей вошли Джордж Буш , Анархизм и Мухаммед . Наибольшую полемику вызвали темы на других языках: Хорватия (немецкий), Сеголен Руаяль (французский), Чили (испанский) и гомосексуализм (чешский). [16]

Политики и правила [ править ]

Описательное исследование [17], в котором анализировались правила и рекомендации англоязычной Википедии до сентября 2007 г., выявило ряд ключевых статистических данных:

  • 44 официальных политики
  • 248 рекомендаций

Было обнаружено, что даже такая короткая политика, как «игнорировать все правила», вызвала много дискуссий и разъяснений:

Хотя сама политика «Игнорировать все правила» состоит всего из шестнадцати слов, страница, объясняющая, что означает эта политика, содержит более 500 слов, отсылает читателей к семи другим документам, вызвала более 8000 слов обсуждения и была изменена более 100 раз в меньше, чем год.

В исследовании отобраны примеры расширения некоторых ключевых политик с момента их создания:

  • Википедия: игнорировать все правила : 3600% (включая дополнительный документ, объясняющий это)
  • Википедия: Консенсус : 1557%
  • Википедия: Авторские права : 938%
  • Википедия: Чем не является Википедия : 929%
  • Википедия: Политика удаления : 580%
  • Википедия: Вежливость : 124%

Однако число для «удаления» было сочтено неубедительным, поскольку политика была разделена на несколько подполитик.

Power Play [ править ]

Совместное рецензируемое исследование 2007 года [18], проведенное исследователями из Вашингтонского университета и HP Labs, изучило, как используются политики и как участники работают над достижением консенсуса, путем количественного анализа выборки активных страниц обсуждения. Используя дамп базы данных английской Википедии за ноябрь 2006 г. , исследование сосредоточилось на 250 страницах обсуждения в хвосте распределения: 0,3% всех страниц обсуждения, но содержащих 28,4% всех ревизий страниц обсуждения и, что более важно, содержащих 51,1% всех ссылок. к политикам. На основе историй отобранных страниц в исследовании были изучены только месяцы с высокой активностью, называемые критическими разделами - наборы последовательных месяцев, когда количество редакций как статей, так и дискуссионных страниц было значительным.

В исследовании был определен и рассчитан показатель распространенности политики. Критическая секция считалась перегруженной политикой, если ее фактор политики был как минимум вдвое выше среднего. Статьи были отмечены тремя индикаторными переменными :

  • спорный
  • избранные
  • политически нагруженный

Все возможные уровни этих трех факторов дали 8 категорий выборки. В исследовании предполагалось проанализировать 9 критических разделов из каждой категории выборки, но можно было выбрать только 69 критических разделов, потому что только 6 статей (историй) были одновременно представлены, противоречивы и содержали политическую подоплеку.

Исследование показало, что политика ни в коем случае не применялась последовательно. В отчете, иллюстрирующем более широкие выводы, были представлены два следующих отрывка из страниц обсуждения Википедии, которые явно контрастируют:

  • обсуждение, в ходе которого участники решили, что расчет среднего значения на основе данных, предоставленных государственным учреждением, представляет собой оригинальное исследование:

среднее ... не считается оригинальным исследованием? [U3]
Мне это не кажется, похоже, что первоначальное исследование было проведено [правительственным агентством], или я что-то упустил? [U4]
Если [правительственное агентство] не опубликовало фактическое среднее значение, мы "вычислили" его ИЛИ, нет? Я не уверен. [U3]
Нет, с чего бы? Экстраполяция данных из уже имеющейся информации не ИЛИ. [U5]
От WP: NOR «статьи не могут содержать новый анализ или синтез опубликованных аргументов, концепций, данных, идей или заявлений, служащих для продвижения позиции». Чего стоит ... [U4]

  • обсуждение, в котором логическая дедукция использовалась в качестве контраргумента для исходной исследовательской политики:

Ваше понятие - WP: ИЛИ. Я могу легко предоставить. . . научная статья, в которой говорится, что антиавторитаризм не является центральным элементом панизма. Здесь вы синтезируете всевозможные идеи на основе вашей точки зрения. [U6]
Простое дедуктивное рассуждение не является оригинальным исследованием. Панизм по своей сути антиавторитарный; следовательно, авторитарная экономическая система не может быть панистской. С чем вы не согласны: с предпосылкой или выводом? [U7]

Утверждая, что такая двусмысленность легко приводит к игре с властью, исследование с использованием методов обоснованной теории (Штраус) выявило 7 типов такой игры:

  • объем статьи (что в статье не по теме)
  • предыдущий консенсус (прошлые решения представлены как абсолютные и неоспоримые)
  • способность интерпретировать (подсообщество, претендующее на больший авторитет в интерпретации, чем другое)
  • легитимность участника (его / ее опыт и т. д.)
  • угроза санкций (блокировка и т. д.)
  • практика на других страницах (другие страницы считаются образцами для подражания)
  • легитимность источника (цитируемая ссылка оспаривается)

Из-за нехватки места в исследовании подробно описаны только первые 4 типа силовых игр, которые осуществлялись путем простой интерпретации политики. Была проанализирована пятая категория игры в большинстве; он состоял из вопиющих нарушений политики, которые прощались, потому что вкладчик ценился за его вклад, несмотря на его неуважение к правилам.

Объем статьи [ править ]

Исследование считает, что политика Википедии неоднозначна в отношении вопросов масштабирования. Следующая виньетка используется для иллюстрации утверждения:

... консенсус - чушь собачья, потому что факты на моей стороне. У меня также есть призыв Википедии быть смелым ... удаление обсуждения католической церкви ... взгляда на палеоцентризм не только неточно, но и нарушает WP: NPOV ... Удаление / выхолащивание его нарушило бы несколько политик Википедии: NPOV, дерзайте ... Если вам всем нужна статья только по научной теории палеоцентризма, напишите ее сами. [U12]
Мы ДЕЙСТВИТЕЛЬНО написали статью только о научной теории палеоцентризма, прежде чем вы появились ... Очевидно, вы здесь новичок, [U12] ... спорить, основываясь на вашем чтении NPOV и быть смелым, немного смешно, как парень только что закончил школу, спорит по вопросам конституционного права. Это принципы, имеющие установленное значение. Люди, живущие здесь много лет, понимают их намного лучше, чем вы. Они не докажут, что вы будете эффективным оружием в этом аргументе ... [U13]
Социальное воздействие «палеоцентризма» - это не «палеоцентризм» ... Википедия: вики - это не бумага, нам не нужно впихивать каждую третичный аспект темы в статью, и нам не нужно считать ее неполной, если мы не ... [U14]
... первое, о чем говорится в ссылке Wikipedia: wiki is not paper: «« Википедия »- это« энциклопедия ».« Настоящая энциклопедия, такая как Encyclopdia Britannica, имеет фантастический раздел о палеоцентризме, включая все социальные, политические и философские подразумеваемое. [U12]
Как обсуждалось в Википедии: вики - это не бумага, статьи Википедии должны давать краткий обзор центрально важных аспектов предмета. Для такого биолога, как вы, центральный аспект палеоцентризма, конечно, не в его социальных последствиях, но для остального общества это так. ... [U12]
... То, о чем вы говорите, не о «палеоцентризме». Центральными проблемами палеоцентризма являются периодическое равновесие, геоморфная волнистость, аэрация. Это вопросы, которые на самом деле имеют отношение к самому процессу палеоцентризма. Эти «социальные аспекты», о которых вы говорите, являются «периферийными», «не центральными». Они «о» палеоцентризме, они «окружают» палеоцентризм, но они «не палеоцентризм» ... [U15]

В исследовании дается следующая интерпретация жарких споров:

Такая борьба за объем статьи имеет место даже в среде с гиперссылками, потому что название статьи имеет значение. Статья «Палеоцентризм» более престижна и к тому же более вероятна для читателя, чем статья, озаглавленная «Социальный эффект палеоцентризма».

Предыдущий консенсус [ править ]

В исследовании отмечается, что консенсус в Википедии никогда не бывает окончательным, и то, что составляет консенсус, может измениться в любой момент. Исследование показывает, что эта временная двусмысленность является благодатной почвой для игры за власть, и ставит борьбу поколений за консенсус в более широкую картину борьбы за право собственности на предметы:

На практике ... часто есть фактические владельцы страниц или коалиции участников, которые определяют содержание статьи. Предыдущий консенсус в этой группе можно представить как неоспоримый, маскирующий силовые игры, которые, возможно, привели к достижению консенсуса. ... Речь идет о легитимности предыдущего консенсуса. Давние участники не хотят тратить время на споры о проблемах, которые они считают решенными. Указание на предыдущий консенсус, как и ссылка на политики, предоставляет метод борьбы с тролльским поведением. С другой стороны, новички или сторонние участники часто чувствуют, что их точки зрения не были представлены в предыдущих аргументах, и хотят снова поднять этот вопрос.

В исследовании используется следующий фрагмент обсуждения, чтобы проиллюстрировать эту непрерывную борьбу:

Почти все, что [U17] описывает ниже, уже было обработано. . . Это похоже на игру в «Ударь крота»: они пробуют один ракурс, и он опровергается; они пробуют второй ракурс, он опровергается; они пробуют третий ракурс, он опровергается; а затем они снова пробуют первый угол. [U18]
Было бы интересно увидеть, как много разных пользователей пытаются внести свой вклад в эту статью и расширить альтернативные взгляды, но только для того, чтобы их оттолкнули те, кто религиозно верит в [Космическую Полярность] ... возможно, они правы и что [U19], [U20] и остальные из вас отталкивают редакторов от этой статьи своим жестким, привилегированным администратором POV-толчком? [U21]

Сила интерпретации [ править ]

Виньетка проиллюстрировала, как администраторы игнорировали консенсус и удаляли личные учетные записи пользователей / пациентов, страдающих анонимным заболеванием (названным в исследовании Frupism). Вмешательство администратора произошло, когда статья выдвигалась как избранная.

Легитимность автора [ править ]

Этот тип игры во власть проиллюстрирован одним из участников (U24), который опирается на свои прошлые вклады, чтобы выступить против другого участника, который обвиняет U24 в непродуктивности и деструктивности:

О, ты имеешь в виду, что «я» тусуюсь, чтобы указать на некачественное содержание Википедии? Пожалуйста, еще раз взгляните на мое количество правок !! РЖУНИМАГУ. У меня более 7000 правок ... Как вы знаете, я могу отдать должное тому, что почти полностью написал с нуля 2 из 6 или 7 ФА по философии ... [U24]

Явное соперничество за право собственности [ править ]

Исследование показало, что есть участники, которые последовательно и успешно нарушают политику без санкций:

U24 ведет несколько вопиющих «мы или они» соперничества за власть: если действия U25 продолжатся, он уйдет. ... Такие действия явно нарушают политику в отношении владения статьями, вежливости по отношению к другим участникам и обращения с новичками. Как новичок, U25 может не знать об этих правилах, но U26 точно знает. Желательная слепота [U26] проистекает из того факта, что U24 является ценным автором статей по философии и не стесняется указывать на это. Очень мало участников, стремящихся постоянно создавать высококачественный контент; Сообщество Wikipedian готово терпеть злоупотребления и нарушения правил, если выполняется ценная работа. ...

При всем уважении, это не ответ на вопрос ... Я хотел знать, что в предложении U25 было неприемлемым. . . Его отсутствие ссылок и т. Д. - это, конечно, ошибка, но именно поэтому я предоставил ее (Запрос, раздел 8). [U26]
... этот момент уже рассмотрен в статье ... Возможно, его нужно немного расширить. Я легко могу это сделать сам, когда у меня будет время ... Есть еще что-нибудь? Поддерживаете ли вы также утверждение U25 о том, что статья «плохая», что ее нужно пересмотреть сверху вниз, подлый и бессмысленный вздор, который он на самом деле пытался вставить выше, или другое ИЛИ, которое он заявил на этой странице? По сути, в этом вопросе есть две стороны, эту статью могут подхватить чудаки, вроде как его зовут или нет? Если это так, я ухожу. Вы можете либо поддержать меня, либо нет. Где ты стоишь? ...
Я ни в коем случае не поддерживаю мнение о том, что статья плохая. Фактически, я не согласен со многими вещами, которые U25 сказал в другом месте на этой странице ... Мне искренне жаль, если это вас расстроило. [U26]

Получение административного статуса [ править ]

В 2008 году исследователи из Университета Карнеги - Меллона разработали пробит модель из английской Википедии редакторами , которые успешно прошли процесс рецензирования стать админов . [19] Используя только метаданные Википедии, включая текст редакционных сводок, их модель была на 74,8% точна в прогнозировании успешных кандидатов.

Газета отметила, что, несмотря на протесты об обратном, «избрание на пост администратора во многих отношениях является поощрением, которое отличает элитную основную группу от большой массы редакторов». Следовательно, в документе использовался анализ политики [20] - метод, который сравнивает номинально важные атрибуты с теми, которые фактически приводят к продвижению по службе в рабочей среде.

Общий коэффициент успешности продвижения по службе снизился с 75% в 2005 году до 53% в 2006 году и до 42% в 2007 году. Это внезапное увеличение количества неудач было связано с более высокими стандартами, которым должны были соответствовать недавно продвинутые администраторы, и подтвержденным анекдотами. данные из другого недавнего исследования [21], в котором цитируются некоторые ранние администраторы, которые выразили сомнение в том, что они пройдут проверку, если их выборы (RfA) состоятся недавно. В свете этих событий в исследовании утверждается, что:

Процесс, который когда-то основатель Википедии назвал «ничего страшного», стал довольно большим событием.

Возможно, вопреки ожиданиям, многократная «баллотировка» администратора снижает шансы кандидата на успех. Каждая последующая попытка имеет на 14,8% меньше шансов на успех, чем предыдущая. Продолжительность участия в проекте вносит лишь небольшой вклад в шанс успешного RfA.

Другой важный вывод статьи состоит в том, что одно изменение политики Википедии или редактирование WikiProject стоит десяти правок статьи. Связанное с этим наблюдение состоит в том, что кандидаты, имеющие опыт работы в различных сферах деятельности, имели больше шансов на избрание. Это было измерено с помощью показателя разнообразия , простого подсчета количества областей, в которых участвовал редактор. В документе Википедия разделена на 16 областей: статьи, статьи, обсуждения, статьи / категории / шаблоны для удаления (XfD), (un) обзор удаления и т. д. (полный список см. в статье). Например, пользователь, который редактировал статьи, свою собственную страницу пользователя и публиковал один раз при (не) удалении обзора, будет иметь оценку разнообразия 3. Внесение одного редактирования в любой дополнительной области Википедии коррелировало с 2,8% -ным увеличением вероятности успех в получении должности администратора.

Небольшие правки также помогли, хотя авторы исследования считают, что это может быть так, потому что незначительные правки коррелируют с опытом. Напротив, каждое редактирование страницы комитета по арбитражу или посредничеству или уведомления в Викикетке , которые являются площадкой для разрешения споров, снижает вероятность успеха на 0,1%. Публикация сообщений на досках объявлений администраторов имела такой же вредный эффект. Исследование интерпретировало это как свидетельство того, что редакторы, вовлеченные в обострение или затягивание конфликтов, снижают их шансы стать администраторами.

Сказание «спасибо» или его варианты в сводках редактирования и указание на проблемы с точки зрения («POV») (также только в сводках редактирования, поскольку в исследовании анализировались только метаданные) имели незначительную пользу, составляя 0,3% и 0,1% от оценок кандидата. шансы в 2006–2007 гг., но ранее не достигали статистической значимости.

Несколько факторов, которые оказались в лучшем случае несущественными или маргинальными:

  • Редактирование пользовательских страниц (в том числе собственных) не помогает. Как ни странно, редактирование страницы обсуждения пользователей также не влияет на вероятность административного вмешательства.
  • Поприветствовать новичков или сказать «пожалуйста» в сводках редактирования не помогло.
  • Участие в формировании консенсуса, таком как голосование в RfA или деревенский насос, не увеличивает вероятность стать администратором. Однако в исследовании признается, что участие в достижении консенсуса измерялось количественно, но не качественно.
  • Борьба с вандалами, измеренная по количеству правок на доске объявлений о вандализмах, не имела никакого эффекта. Каждая тысяча правок, содержащих вариации «возврата», была положительно коррелирована (7%) с административным уровнем за 2006–2007 гг., Но не достигла статистической значимости, если только кто-то не желает снизить порог до p <.1). Что еще более сбивает с толку, до 2006 года количество возвратов отрицательно коррелировало (-6,8%) с успехом администрирования, по сравнению с отсутствием достижения статистической значимости даже при p <0,1. Это может быть связано с введением в 2006 году политики, известной как «3RR», для сокращения возвратов. [22]

Исследование предполагает, что некоторая из 25% необъяснимой вариабельности результатов может быть связана с факторами, которые не были измерены, такими как качество редактирования или участие во внешней координации, например (явно цитируемый) секретный список рассылки, указанный в Регистре. . [23] В документе делается вывод:

Простого выполнения большого объема производственной работы недостаточно для «продвижения» в Википедии. Редактирование статей кандидатов было слабым предиктором успеха. Они также должны демонстрировать более управленческое поведение. Разнообразный опыт и вклад в разработку политики и проектов Wiki были более сильными предикторами успеха RfA. Это согласуется с выводами о том, что Википедия - это бюрократия [17], и что работа по координации существенно возросла. [24] [25] ... Участие в политике Википедии и WikiProjects не предполагало возможности администрирования до 2006 года, что говорит о том, что сообщество в целом начинает отдавать приоритет выработке политики и опыту организации над простой координацией на уровне статей.

Последующее исследование, проведенное другой группой [26], исследовало мыслительную деятельность людей во время их вклада в решения RfA. Эта работа устанавливает, что решения о кандидатах RfA основаны на общей интерпретации свидетельств вики и историй предыдущих взаимодействий.

Википедия в образовании [ править ]

Несмотря на нежелание учителей использовать Википедию в качестве основы для работы в классе, было обнаружено, что использование учениками Википедии ( ивритская Википедия для этой статьи) повышает их интерес к процессу обучения, их вклад в результаты своей работы, их успехи. в их обучении и личностном развитии, а также возможности студентов для местного и международного сотрудничества. [27]

Машинное обучение [ править ]

Автоматическое извлечение семантических знаний с использованием алгоритмов машинного обучения используется для «извлечения машинно-обрабатываемой информации с относительно низкими затратами сложности». [28] DBpedia использует структурированный контент, извлеченный из информационных ящиков статей Википедии на разных языках с помощью алгоритмов машинного обучения, для создания ресурса связанных данных в семантической сети . [29]

Википедия просматривает статистику и поведение человека [ править ]

В исследовании, опубликованном в PLoS ONE [30], Таха Яссери из Оксфордского института Интернета и его коллеги из Центральноевропейского университета показали, что статистика просмотров страниц статей о фильмах хорошо коррелирует с их кассовыми сборами. Они разработали математическую модель для прогнозирования кассовых сборов путем анализа количества просмотров страниц, а также количества правок и уникальных редакторов страниц Википедии о фильмах. Хотя эта модель была разработана на основе английской Википедии для фильмов, независимые от языка методы могут быть распространены на другие языки и на другие виды продукции, помимо фильмов. [31]

В работе, опубликованной в Scientific Reports в 2013 г. [32], Хелен Сюзанна Моут , Тобиас Прейс и ее коллеги продемонстрировали связь между изменениями в количестве просмотров статей английской Википедии, касающихся финансовых тем, и последующими крупными изменениями на фондовом рынке США. [33] [34]

Ссылки [ править ]

  1. ^ S - Такман, Джефф; Пуртило, Джеймс (2009). Измерение викисферы . Материалы 5-го Международного симпозиума по вики и открытому сотрудничеству . п. 1. дои : 10,1145 / 1641309,1641326 . ISBN 978-1-60558-730-1. S2CID  17770818 .
  2. ^ Приедорский, Рид; Чен, Цзилинь; Лам, Снайдер (Тони); Пансьера, Катерина; Тервин, Лорен; Остин, Шейн (2007). «Создание, уничтожение и восстановление ценностей в Википедии». Материалы международной конференции ACM 2007 г. «Поддержка групповой работы» . Конференция по поддержке групповой работы . ACM Press. С. 259–268. DOI : 10.1145 / 1316624.1316663 . ISBN 978-1-59593-845-9.
  3. ^ Бейкер, Николсон (2008-04-10). «Как я полюбил Википедию» . Хранитель . Проверено 29 ноября 2010 .
  4. ^ Чи, Эд; Киттур, Аникет; Пендлтон, Брайан А .; Сух, Бонгвон и Мыткович, Тодд (31 января 2007 г.). «Сила немногих против мудрости толпы: Википедия и рост буржуазии» (PDF) . Конференция «Компьютер / Взаимодействие человека 2007» . Ассоциация вычислительной техники . S2CID 14770727 . Проверено 23 апреля 2017 .  
  5. ^ Гудвин, Жан. (2010). Авторитет Википедии. В Джухо Ритола (ред.), Культура аргументов: Материалы конференции Общества изучения аргументации Онтарио. Виндзор, Онтарио, Канада: Общество изучения аргументации Онтарио. CD-ROM, 24 стр.
  6. ^ Грэм, Марк (2009-11-12). «Составление карты географии содержания Википедии» . Марк Грэм: Блог . ZeroGeography. Архивировано из оригинала на 2009-12-08 . Проверено 16 ноября 2009 .
  7. Габрилович Евгений; Маркович, Шауль (2007). «Вычисление семантического родства с использованием явного семантического анализа на основе Википедии». Труды IJCAI . Морган Кауфманн Паблишерс Инк., Стр. 1606–1611. CiteSeerX 10.1.1.76.9790 . 
  8. ^ Зеш, Торстен; Мюллер, Кристоф; Гуревич, Ирина (2008). «Извлечение лексико-семантических знаний из Википедии и Викисловаря» (PDF) . Труды конференции по языковым ресурсам и оценке (LREC) .
  9. ^ M Strube; С. П. Понцетто (2006). «WikiRelate! Вычисление семантической взаимосвязи с использованием Wikipedia psu.edu» (PDF) . Материалы национальной конференции. Цитировать журнал требует |journal=( помощь )
  10. ^ Лоран, MR; Викерс, Т.Дж. (2009). «Поиск медицинской информации в Интернете: имеет ли значение Википедия?» . Журнал Американской ассоциации медицинской информатики . 16 (4): 471–479. DOI : 10.1197 / jamia.M3059 . PMC 2705249 . PMID 19390105 .  
  11. ^ Хейлман, JM; Кемманн, Э; Бонерт, М; Чаттерджи, А; Рагар, Б; Бороды, GM; Иберри, диджей; Харви, М; Томас, B; Стомп, Вт; Martone, MF; Лодж, диджей; Вондрачек, А; де Вольф, JF; Liber, C; Гровер, Южная Каролина; Виккерс, Т.Дж.; Меско, В; Лоран, MR (31 января 2011 г.). «Википедия: ключевой инструмент для укрепления здоровья населения во всем мире» . Журнал медицинских интернет-исследований . 13 (1): e14. DOI : 10,2196 / jmir.1589 . PMC 3221335 . PMID 21282098 .  
  12. ^ Билл Тансер (2007-04-25). «Кто действительно участвует в Web 2.0» . Журнал Time . Архивировано 30 апреля 2007 года . Проверено 30 апреля 2007 .
  13. ^ Sumi, R .; Яссери, Т .; Rung, A .; Корнаи, А .; Kertesz, J. (1 октября 2011 г.). «Редактировать войны в Википедии». Третья международная конференция IEEE 2011 года по конфиденциальности, безопасности, рискам и доверию и Третья международная конференция IEEE 2011 года по социальным вычислениям . С. 724–727. arXiv : 1107,3689 . DOI : 10.1109 / PASSAT / SocialCom.2011.47 . ISBN 978-1-4577-1931-8. S2CID  14151613 - через IEEE Xplore.
  14. ^ Szolnoki Аттила; Яссери, Таха; Суми, Роберт; Кертес, Янош (2012). «Циркадные модели редакционной активности Википедии: демографический анализ» . PLOS ONE . 7 (1): e30091. DOI : 10.1371 / journal.pone.0030091 . ISSN 1932-6203 . PMC 3260192 . PMID 22272279 .   
  15. ^ Török, J; Иньигес, G; Яссери, Т; Сан-Мигель, М; Каски, К; Кертес, Дж (2013). «Мнения, конфликты и консенсус: моделирование социальной динамики в совместной среде». Письма с физическим обзором . 110 (8): 088701. arXiv : 1207.4914 . Bibcode : 2013PhRvL.110h8701T . DOI : 10.1103 / PhysRevLett.110.088701 . PMID 23473207 . S2CID 2496524 .   цитируется
    • Раткевич, Яков; Фортунато, Санто; Фламмини, Алессандро; Менцер, Филиппо; Веспиньяни, Алессандро (2010). «Характеристика и моделирование динамики онлайн-популярности» . Письма с физическим обзором . 105 (15): 158701. DOI : 10,1103 / PhysRevLett.105.158701 . ISSN  0031-9007 . PMID  21230945 .
    • Сольноки, Аттила; Яссери, Таха; Суми, Роберт; Рунг, Андраш; Корнаи, Андраш; Кертес, Янош (2012). «Динамика конфликтов в Википедии» . PLOS ONE . 7 (6): e38869. DOI : 10.1371 / journal.pone.0038869 . ISSN  1932-6203 . PMC  3380063 . PMID  22745683 .
  16. ^ Яссери Т .; Spoerri A .; Graham M .; Кертес Дж (2014). «Самые спорные темы в Википедии: многоязычный и географический анализ». В Fichman P .; Хара Н. (ред.). Глобальная Википедия: Международные и межкультурные вопросы онлайн-сотрудничества . Лэнхэм, Мэриленд: Rowman and Littlefield Press. arXiv : 1305,5566 . ISBN 978-0-8108-9101-2. OCLC  1026054095 .
  17. ^ a b Батлер, Брайан; Джойс, Элизабет; Пайк, Жаклин (2008). Не смотрите сейчас, но мы создали бюрократию . Материалы двадцать шестой ежегодной конференции CHI по человеческому фактору в вычислительных системах - CHI '08 . п. 1101. DOI : 10,1145 / 1357054,1357227 . ISBN 978-1-60558-011-1. S2CID  15211227 .
  18. ^ Криплин, Трэвис; Бесчастных, Иван; Макдональд, Дэвид В .; Голдер, Скотт А. (2007). Сообщество, консенсус, принуждение, контроль . Материалы Международной конференции ACM 2007 г. по конференции по поддержке групповой работы - GROUP '07 . п. 167. DOI : 10,1145 / 1316624,1316648 . ISBN 978-1-59593-845-9. S2CID  14491248 .
  19. ^ Берк, Мойра; Краут, Роберт (2008). Берём швабру . Труды Двадцать шестой ежегодной конференции ОМС Расширенные тезисы по человеческому фактору в вычислительных системах - CHI '08 . п. 3441. DOI : 10,1145 / 1358628,1358871 . ISBN 978-1-60558-012-8.
  20. ^ Штумпф, SA; Лондон, М. (1981). «Учет политики рейтеров при оценке кандидатов на повышение». Журнал Академии управления . 24 (4): 752–766. DOI : 10.2307 / 256174 . JSTOR 256174 . 
  21. ^ Форте, А., и Брукман, А. Масштабируемый консенсус: усиление децентрализации в управлении Википедией. Proc. HICSS 2008.
  22. ^ WP: 3RR и WP: EW , политики, предотвращающие повторный возврат.
  23. ^ Мец, Кейд. «Секретный список рассылки потрясает Википедию» . Реестр .
  24. ^ Киттур, Аникет; Suh, Bongwon; Пендлтон, Брайан А .; Чи, Эд Х. (2007). Он говорит, она говорит: конфликт и координация в Википедии . Труды конференции SIGCHI по человеческому фактору в вычислительной технике . С. 453–462. DOI : 10.1145 / 1240624.1240698 . ISBN 978-1-59593-593-9. S2CID  17493296 .
  25. ^ Вьегас, Фернанда Б .; Ваттенберг, Мартин; Крисс, Джесси; ван Хам, Франк (2007). «Поговорите, прежде чем печатать: координация в Википедии». 40-я ежегодная Гавайская международная конференция по системным наукам : 575–582. CiteSeerX 10.1.1.210.1057 . DOI : 10.1109 / HICSS.2007.511 . ISBN  978-0-7695-2755-0. S2CID  5293547 .
  26. ^ Derthick, К., П. Тсао, Т. Kriplean, А. Borning, М. Zachry и DW Макдональд (2011). Совместное создание смысла во время предоставления прав администратора в Википедии. В AA Ozok and P. Zaphiris (Eds.): Online Communities, HCII 2011, LNCS 6778, pp. 100–109.
  27. ^ Герц, Техила (2018). «Викиштетль: память еврейских общин, погибших во время Холокоста, через платформу Википедии» . Квест . 13 .
  28. ^ Баеза-Йейтс, Рикардо; Кинг, Ирвин, ред. (2009). Службы ткачества и люди во всемирной паутине . Springer. ISBN 978-3-642-00569-5. LCCN  2009926100 .
  29. ^ Ю, Лиян (2011). Руководство разработчика по семантической сети . Springer. DOI : 10.1007 / 978-3-642-15970-1 . ISBN 978-3-642-15969-5.
  30. ^ Мартон Местьян; Таха Яссери; Янош Кертес (2013). «Раннее предсказание кассовых сборов фильмов на основе больших данных о деятельности в Википедии» . PLoS ONE . 8 (8): e71226. arXiv : 1211.0970 . Bibcode : 2013PLoSO ... 871226M . DOI : 10.1371 / journal.pone.0071226 . PMC 3749192 . PMID 23990938 .  
  31. ^ «Википедия предсказывает, что фильмы-блокбастеры выйдут за несколько недель до релиза» . Хранитель . 8 ноября 2012 . Проверено 2 сентября 2013 года .
  32. Хелен Сюзанна Моут; Честер Курм; Адам Авакян; Дрор Ю. Кенетт; Х. Юджин Стэнли; Тобиас Прейс (2013). «Количественная оценка моделей использования Википедии до движения фондового рынка» . Научные отчеты . 3 : 1801. Bibcode : 2013NatSR ... 3E1801M . DOI : 10.1038 / srep01801 . PMC 3647164 . 
  33. ^ "Хрустальный шар Википедии" . Financial Times . 10 мая 2013 года . Проверено 10 августа 2013 года .
  34. ^ Кадхий Shubber (8 мая 2013). «Просмотры страниц Википедии могут предсказать изменения на фондовом рынке» . Wired.com . Проверено 10 августа 2013 года .

Дальнейшее чтение [ править ]

  • Адлер, БТ; де Альфаро, Л. (2007). «Система репутации Википедии, основанная на содержании». Материалы 16-й международной конференции по всемирной паутине . Нью-Йорк: ACM. С. 261–270. CiteSeerX  10.1.1.728.9724 . DOI : 10.1145 / 1242572.1242608 . ISBN 978-1-59593-654-7. S2CID  405135 .
  • Amichai-Hamburger, Y .; Lamdan, N .; Madiel, R .; Хаят, Т. (2008). «Личностные характеристики участников Википедии». Киберпсихология и поведение . 11 (6): 679–681. DOI : 10,1089 / cpb.2007.0225 . PMID  18954273 .
  • Блюменшток, Дж. Э. (2008). «Размер имеет значение: количество слов как показатель качества в Википедии». Материалы 17-й международной конференции по всемирной паутине . Нью-Йорк: ACM. С. 1095–1096. DOI : 10.1145 / 1367497.1367673 . ISBN 978-1-60558-085-2. S2CID  8896540 .
  • Брайант, SL; Для чая.; Брукман, А. (2005). «Стать Wikipedian: преобразование участия в совместной онлайн-энциклопедии». GROUP '05 Материалы международной конференции ACM SIGGROUP 2005 г. по поддержке групповой работы . Нью-Йорк: ACM. DOI : 10.1145 / 1099203.1099205 . ISBN 978-1-59593-223-5. S2CID  221349 .
  • Farrell, H .; Шварцберг, М. (2008). «Нормы, меньшинства и коллективный выбор в Интернете» . Этика и международные отношения . 22 (4): 357–367. DOI : 10.1111 / j.1747-7093.2008.00171.x . Архивировано из оригинального 20 -го января 2009 года . Проверено 3 февраля 2009 .
  • Hu, M .; Lim, E.-P .; Sun, A .; Lauw, HW; Вуонг, Б.-К. (2007). «Измерение качества статей в Википедии: модели и оценка». Материалы шестнадцатой конференции ACM по управлению информацией и знаниями . Нью-Йорк: ACM. DOI : 10.1145 / 1321440.1321476 . ISBN 978-1-59593-803-9. S2CID  654234 .
  • Дженсен, Ричард (2012). «Военная история на электронных рубежах: Википедия о войне 1812 года» (PDF) . Журнал военной истории . 76 (4): 523–556.
  • Копф, Сюзанна. «Транснациональные дискуссии о Европейском Союзе: построение ЕС членами Википедии на странице обсуждения в Википедии (2001-2015)». (Докторская диссертация в Ланкастерском университете, 2018 г.) онлайн. Архивировано 16 мая 2019 г. в Wayback Machine .
  • Кузнецов, С. (2006). «Мотивы авторов Википедии». ACM SIGCAS Компьютеры и общество . 36 (2): 1 – es. DOI : 10.1145 / 1215942.1215943 . S2CID  1115614 .
  • Luyt, B .; Аарон, ТКП; Thian, LH; Хонг, СК (2008). «Повышение точности Википедии: можно ли решить проблему возраста редактирования?». Журнал Американского общества информационных наук и технологий . 59 (2): 318–330. DOI : 10.1002 / asi.20755 .
  • Меделян, О .; Milne, D .; Legg, C .; Виттен, IH (2008). «Горное значение из Википедии». arXiv : 0809.4530 [ cs.AI ].
  • Парк, ТЗ (2011). «Заметность Википедии в научных публикациях» . Первый понедельник . 16 (8). DOI : 10.5210 / fm.v16i8.3492 . hdl : 2022/21757 . Архивировано из оригинала на 2012-04-04 . Проверено 9 августа 2011 .
  • ван Пинкстерен, Б. (2017). «Африканские языки в Википедии - наполовину полный или наполовину пустой стакан?». Политическая экономия - Развитие: электронный журнал сравнительной региональной экономики . 5 (12). SSRN  2939146 .
  • Рейшхауэр, Эмиэль (2019). Организационная демократия. Концентрация власти и самоорганизация в развитии Википедии (дисс. Ред.). Роттердам: Университет Эразма в Роттердаме. hdl : 1765/113937 . OCLC  1081174169 .
  • Шахаф, П. (2009). «Парадокс опыта: справочная служба Википедии так же хороша, как и ваша библиотека?» . Журнал документации . 65 (6): 977–996. DOI : 10.1108 / 00220410910998951 .
  • Shachaf, P .; Хара, Н. (2010). «За гранью вандализма: Википедия троллей» (PDF) . Журнал информатики . 36 (3): 357–370. DOI : 10.1177 / 0165551510365390 . S2CID  21846015 .
  • Stein, K .; Гесс, К. (2007). «Имеет значение, кто участвует: исследование избранных статей в немецкой Википедии». Материалы восемнадцатой конференции по гипертексту и гипермедиа . Нью-Йорк: ACM. DOI : 10.1145 / 1286240.1286290 . ISBN 978-1-59593-820-6. S2CID  16649948 .
  • Suh, B .; Chi, EH; Kittur, A .; Пендлтон, BA (2008). Приоткрывая завесу: повышение подотчетности и социальной прозрачности в Википедии с помощью wikidashboard . Труды Двадцать шестой ежегодной конференции SIGCHI по человеческому фактору в вычислительных системах . п. 1037. DOI : 10,1145 / 1357054,1357214 . ISBN 978-1-60558-011-1. S2CID  17070584 .
  • Urdaneta, G .; Pierre, G .; ван Стин, М. (2009). «Анализ рабочей нагрузки Википедии для децентрализованного хостинга» . Компьютерные сети . 53 (11): 1830–1845. CiteSeerX  10.1.1.148.6299 . DOI : 10.1016 / j.comnet.2009.02.019 .
  • Vuong, B.-Q .; Lim, E.-P .; Sun, A .; Le, M.-T .; Lauw, HW; Чанг, К. (2008). «О рейтинговых спорах в Википедии: модели и оценки». Труды Международной конференции по веб - поиска и интеллектуального анализа данных 2008 . Нью-Йорк: ACM. DOI : 10.1145 / 1341531.1341556 . ISBN 978-1-59593-927-2. S2CID  12504471 .
  • Уилсон, Дж. (2014). «Действовать с особой осторожностью: цитирование Википедии в свете демографических данных авторов и политик в отношении содержания». Журнал Вандербильта по закону о развлечениях и технологиях, 16 (4). Получено с https://ssrn.com/abstract=2474110
  • Зикур, К., и Рейни, Л. (2011). «Википедия, прошлое и настоящее: снимок текущих пользователей Википедии». Получено с веб-сайта Pew Research Center: http://www.pewinternet.org/2011/01/13/wikipedia-pastand-present/ [ постоянная мертвая ссылка ]

Внешние ссылки [ править ]

  • WikiPapers - сборник ресурсов (документы конференций, журнальные статьи, тезисы, книги, наборы данных и инструменты), ориентированный на исследование вики и Википедии.