Википедия 1.0 - ( обсуждение ) FAQ - Сделать |
---|
Руководство по инструментам выпуска версии - (обсуждение) - (статистика) |
Процесс отбора статей (обсуждение) Версия 0.8 Выбор бота Отзыв о версии 0.8 |
Канал IRC ( IRC ) |
Критерии выпуска |
Группа проверки ( FAQ ) |
Выпуск версии 0.8 (выбор вручную) (t) |
Проект "Выборка" ( Обсуждение ) выбор школ |
ОСНОВНЫЕ ТЕМЫ ОСНОВНОЕ ДОПОЛНЕНИЕ Основные темы - 1000 ( Обсуждение ) ( COTF) (бот) |
ТОРРЕНТ ( Обсуждение ) |
Детский проект "Подборка" ( (t) ) |
РАБОТА ЧЕРЕЗ WIKI PROJECTS ( обсуждение ) |
Переход на 1.0 ( обсуждение ) |
Подкомиссия по статическому контенту. |
Процесс выбора статей для автономных выпусков Википедии в настоящее время в основном автоматизирован. Он специально используется для сборки так называемых релизных версий ; следующий выпуск (по состоянию на сентябрь 2011 г.) называется версией 0.9 .
Пользователь: WP 1.0 бот собирает информацию о качестве и важности статей для этих WikiProjects . Эти данные затем используются для ранжирования статей на основе сочетания качества и важности (как описано ниже), и статьи выбираются на основе этих рейтингов. Чтобы ничего не упустить из виду, отдельные статьи по-прежнему можно номинировать вручную, а затем проверять. Этот подход использовался для всех выпусков, начиная с версии 0.7 (31 000 статей).
Бот вычисляет числовую оценку для каждой статьи. Статьи, набранные выше определенного порога (который будет меняться от одного выпуска к другому), будут включены в версию выпуска. Порог для версии 0.8 был установлен на 1240. На этой странице описан алгоритм, который бот-селектор использует для присвоения оценок.
Более старые тесты описаны в Википедии: Редакционная группа версии 1.0 / Отборочные испытания .
Техника подбора
Бот выставляет оценку для каждой статьи в каждом проекте, который оценил статью. Общая оценка статьи состоит из двух компонентов: оценки важности и оценки качества:
Overall article score = Importance_score + Quality score.
У статьи будет одна общая оценка для каждого проекта, оценивающего статью. Наивысший балл, присвоенный статье любым проектом, определяет, будет ли статья включена в окончательную версию.
Оценка важности
В большинстве случаев общая оценка важности получается путем добавления баллов на основе важности, присвоенной WikiProject, и баллов на основе внешнего интереса к статье:
Importance score = Assessed_importance_points + External_interest_points.
Некоторые Wiki-проекты , такие как WP: MILHIST , предпочли не оценивать важность. В таких случаях общая оценка важности рассчитывается с использованием только внешних точек интереса:
Importance_score = External_interest_points * (4/3).
Эта формула также используется для статей, важность которых помечена как «Неизвестный класс» или «Неоцененный класс».
Оцененные баллы важности
Оценка важности статьи используется для присвоения баллов на основе самого WikiProject и рейтинга важности, присвоенного статье:
Assessed_importance points = Base_importance_points + WikiProject_scope_points.
В пунктах базы важности взяты из следующей таблицы.
Рейтинг | Вершина | Высокая | Середина | Низкий |
Точки | 400 | 300 | 200 | 100 |
Если важность не оценивается, используется формула 4/3, а базовые баллы важности не используются в окончательном подсчете баллов. В этом случае очки за область действия Википроекта также не учитываются в окончательной оценке.
Точки охвата WikiProject
Точки области видимости WikiProject используются для компенсации разницы в масштабах между WikiProjects. Например, WikiProject по географии имеет очень широкую сферу применения, а WikiProject на Аландских островах - более узкую.
Точки охвата WikiProject обычно основаны на точках внешнего интереса, определенных ниже, для наиболее важной статьи, которая наилучшим образом представляет объем проекта. Например, Wikipedia: WikiProject Chicago лучше всего представлена статьей Chicago .
Некоторые проекты охватывают несколько тем либо явно ( Wikipedia: WikiProject Amphibians and Reptiles ), либо неявно ( Wikipedia: WikiProject Kingdom of Naples включает Королевство Обеих Сицилий ). В этих случаях точки охвата WikiProject основаны на двух или более статьях, охватывающих основные темы WikiProject.
В других случаях нет ни одной статьи, адекватно представляющей весь проект, или «репрезентативная» статья имеет гораздо более низкий балл, чем основные темы в рамках этой темы. В таких случаях можно выбрать две или три важнейших статьи, которые лежат в основе темы. Например, статьи Джими Хендрикса и Эрика Клэптона были выбраны для Wikipedia: WikiProject Guitarists .
Чтобы вычислить оценку WikiProject, когда рассматривается несколько статей, подсчет просмотров страниц, входящие ссылки на страницы и межвики-ссылки для всех статей суммируются, а затем используются, как если бы они были данными для одной статьи в формуле для внешних точек интереса. нижеприведенный. Это приводит к сырой оценке . Распределение исходных оценок для Википедии 0,7 показано в следующей таблице.
Процентиль | На 10% ниже | На 25% ниже | 50% ниже | 75% ниже | 90% ниже |
Предварительный Счет | 785 | 900 | 1025 | 1130 | 1200 |
Очки охвата Википроекта получаются путем вычитания 1000 из исходной оценки и деления полученного числа на 2.
Целевые группы и дочерние проекты
Многие Wiki-проекты, такие как WP: Films и WP: Australia , используют целевые группы для оценки специализированных областей в рамках своей общей области. В некоторых случаях (например, WP: Австралия ) целевая группа может оценить важность в рамках специальной области независимо от оценок важности родительского проекта. В этих случаях для дочернего проекта рассчитывается отдельная оценка Википроекта. В других случаях (например, WP: Philosophy ) важность оценивается только родительским проектом. В этих случаях оценка Wikiproject родительского проекта используется в качестве оценки Wikiproject для дочернего проекта.
Внешние точки интереса
Эти баллы измеряют внешний интерес к статье, независимо от оценок, присвоенных WikiProject. Баллы формируются путем объединения количества просмотров страницы (hitcount), а также количества входящих внутренних ссылок и количества входящих межвики-ссылок из Википедии на других языках:
External interest points = 50 * log10(hitcount) + 100 * log10(internal links) + 250 * log10(interwiki links)
Счетчики просмотров страниц, ссылок на страницы и межвики-ссылок для всех страниц, которые перенаправляют на данную статью, добавляются к собственным счетчикам статьи до того, как вычисляются внешние точки интереса.
Данные о количестве посещений получены из http://dammit.lt/wikistats/ (это те же данные, которые использует http://stats.grok.se ). На основе этих данных формируется список ежедневных посещений за период в несколько недель. Для каждой статьи самые высокие 20 процентов и самые низкие 20 процентов этих ежедневных количеств обращений отбрасываются, а оставшиеся точки данных усредняются (см. Усеченное среднее ). Полученная статистика используется в качестве меры типичного ежедневного просмотра страницы статьи. Статистика попаданий, отображаемая в статистике выбора бота на сервере инструментов, на самом деле является ежемесячным подсчетом обращений.
Показатель качества
Оценка качества статьи в проекте основана на оценке качества, присвоенной википроектом.
Рейтинг | FA | FL | А | GA | B | C | Начинать | Другой |
Точки | 500 | 500 | 400 | 400 | 300 | 225 | 150 | 0 |