Это информационная страница . Это не одна из политик или руководств Википедии , а скорее предназначена для описания некоторых аспектов норм, обычаев, технических особенностей или практик Википедии. Это может отражать различные уровни консенсуса и проверки . |
Существует множество способов, которыми Википедия пытается контролировать индексацию поисковой системы , обычно называемую в Википедии «неиндексированием». По умолчанию страницы индексируются. Все методы основаны на использовании метатега noindex HTML , который сообщает поисковым системам не индексировать определенные страницы. Соблюдение тега, особенно с точки зрения удаления уже проиндексированного контента, зависит от отдельной поисковой системы, и теоретически тег может быть полностью проигнорирован.
Методы контроля:
- Управление всем пространством имен через настройки программного обеспечения MediaWiki
- Управление классов страниц, с помощью MediaWiki: Robots.txt (Википедия Robots.txt файл)
- Управление отдельными страницами путем добавления к ним
__NOINDEX__
волшебного слова либо напрямую, либо с помощью шаблона {{ NOINDEX }}, однако статьи - это особый случай, см. # Индексирование статей ("mainspace") . - Управление несколькими страницами путем добавления
__NOINDEX__
волшебного слова в стандартные шаблоны, используемые в определенных ситуациях (та же оговорка, что и в третьем пункте);
Индексирование статей ("mainspace") [ править ]
Статьи старше 90 дней индексируются автоматически. [1]__NOINDEX__
слово магия и {{ NOINDEX }} шаблон не работать на них. Статьи младше 90 дней не индексируются, если они не прошли патрулирование и не содержат шаблон {{ NOINDEX }} (или шаблон, включающий шаблон {{ NOINDEX }}, например шаблоны быстрого удаления). [2] [3] [4]__NOINDEX__
волшебное слово делает не работать на них. Обратите внимание, что & action = info неверно указывает, что они проиндексированы. [5] Статьи, содержащие шаблон {{ NOINDEX }}, перечислены по адресуКатегория: Статьи без индексации .
Это патрулирование может выполняться автоматически программным обеспечением, как в случае статей, созданных редакторами с правом пользователя с автоматическим патрулированием , или другим редактором с правом пользователя нового рецензента страницы (не путать с правом пользователя рецензента ожидающих изменений ).
Другие пространства имен и robots.txt [ править ]
Управление пространством имен [ править ]
На английской Википедии вся User:
[6] пространство имен , User talk:
, Draft:
и Draft talk:
пространство имен автоматически noindexed через настройку программного обеспечения. [7]
В то же время __NOINDEX__
и __INDEX__
отключены, помимо пространства статей , в пространстве имен Draft и пространстве имен Draft talk; они там не действуют. [8]
Неиндексирование robots.txt [ править ]
MediaWiki: Robots.txt запрещает аналитическим инструментам посещать конфиденциальные или потенциально конфиденциальные типы страниц, в первую очередь в пространстве имен Википедии - например, дискуссии об удалении . Побочный эффект непосещения обычно заключается в том, что страницу нельзя проиндексировать. По возможности вы должны дополнительно использовать __NOINDEX__ для этих страниц.
Волшебное слово NOINDEX [ править ]
Отдельные страницы [ править ]
Отдельные страницы можно не проиндексировать, добавив __NOINDEX__
волшебное слово на эту страницу напрямую или с помощью шаблона {{ NOINDEX }}. Как объяснялось выше, это волшебное слово не работает в основном пространстве (в статьях).
Страницы с ключевым словом перечислены в Категория: Неиндексированные страницы . [9]
Стандартный шаблон noindexing [ править ]
Некоторые стандартные шаблоны включают __NOINDEX__
ключевое слово, тем самым не индексируя страницы, к которым применяются шаблоны. Такие шаблоны должны быть перечислены в Категории: шаблоны Википедии, в которых применяется NOINDEX .
Неиндексируемая страница обсуждения биографий живых людей [ править ]
Шаблоны {{ BLP }} и {{ BLP others }} включают параметр {{ NOINDEX }}. Шаблон {{ BLP }} автоматически добавляется шаблоном страницы обсуждения {{ WikiProject Biography }}, если задан параметр |living=yes
; см. документацию к этому шаблону для получения более подробной информации. Страницы, использующие эти шаблоны, автоматически попадают в категорию « Категория: Биографические статьи живых людей» .
Другие шаблоны [ править ]
Эти шаблоны включают {{ NOINDEX }}:
- {{ Тестовая среда пользователя }}, {{ Проект пользовательского пространства }}
- {{ Sockpuppet }}, {{ Sockpuppeteer }}, {{ IPsock }}, {{ Banned user }}, {{ Blocked user }} и другие
- {{ Db-meta }} и {{ Deletable file }}, а также различные шаблоны быстрого удаления, созданные на его основе
- {{ Prod blp }}
См. Также Категория: шаблоны Википедии, в которых применяется NOINDEX .
- {{ Uw-userspacenoindex }} предоставляет пользователю предупреждающее сообщение о ненадлежащем использовании пользовательского пространства, которое не требует индексации.
Волшебное слово INDEX [ править ]
Отдельные страницы [ править ]
Отдельные страницы могут переопределить noindexing пространств имен, добавив __INDEX__
волшебное слово на эту страницу, либо напрямую, либо с помощью шаблона {{ INDEX }}. Такие страницы появляются в Категории: Проиндексированные страницы . Однако INDEX не отменяет noindexing через MediaWiki: Robots.txt . [10] Как объяснялось выше, это волшебное слово не работает в основном пространстве (в статьях).
Возможность добавить INDEX волшебного слова пользовательских пространств (User :, Обсуждение участника :) была ограничена с редактированием фильтром для расширенных подтвержденных пользователей после обсуждения сообщества. [11]
HTML-атрибут Nofollow [ править ]
С 2007 года для всех ссылок на другие сайты из английской Википедии установлен атрибут HTML nofollow . [12] Это означает, что на страницах, которые индексируются поисковыми системами, любые ссылки, найденные поисковой системой на этих страницах, не должны влиять на рейтинг целевой ссылки в индексе поисковой системы.
Прошлые обсуждения [ править ]
Обсуждения пространств имен [ править ]
- Википедия: Запросы на комментарии / Индексирование страницы пользователя
- Википедия: Индексирование поисковой системой - Предложение изменить настройки пространства имен для индексации
- Википедия: NOINDEX из доски объявлений - Мертвый / спорно предложение NOINDEX доски объявлений
- Википедия: Деревенский насос (предложения) / Архив 35 # Пространства имен в Robot.txt - Предложение не индексировать несколько непонятных пространств имен, таких как « Обсуждение изображений». Сильное большинство выступило против.
- Википедия: Деревенский насос (предложения) / Архив 36 # Повторно включить поиск в пространстве для разговоров пользователей - Предложение переиндексировать страницы обсуждений пользователей. Большинство против.
- Википедия: Village pump (policy) / Archive 59 # NOINDEX всех пространств имен, не относящихся к содержанию - Смешанное обсуждение для исключения из индексации всех пространств имен, не относящихся к содержанию.
- Википедия: Деревенский насос (политика) / Архив 62 # Где и когда использовать NOINDEX для удаления страниц из поисковых систем - Предложение исключить определенные страницы из индексации.
- Википедия: страницы обсуждения, не проиндексированные Google - предложение сообщить Google не индексировать пространство имен Talk :.
- Википедия: Запросы на комментарий / NOINDEX - Предложение NOINDEX о непатрулированных новых статьях и статьях с определенными шаблонами удаления.
- Википедия: Village pump (предложения) / Архив 126 # Черновики пользовательских страниц отображаются в поисковых системах по умолчанию без индексации.
Обсуждения отдельных шаблонов [ править ]
- Обсуждение шаблона: Несвободные медиа # Добавление NOINDEX - Предложение к NOINDEX несвободным изображениям. Нет единого мнения.
- Обсуждение шаблона: WikiProject Biography / Archive 5 # Noindex - Предложение к шаблону страницы обсуждения NOINDEX BLP
- Обсуждение шаблона: доска объявлений администраторов navbox all - NOINDEX в шаблоне архивов AN
Текущие проблемы [ править ]
- T26169 / phab: T24251 - «Создать
__NOINDEX__
аналог, чтобы предотвратить индексацию внутренней поисковой системой»
Заметки [ править ]
- ^ 2017 переход с 30 на 90 дней
- ^ T147544
- ^ Исходный код PageTriage
- ^ Значение $ wgRCMaxAge на вики WMF
- ^ См. T157747
- ^ Решено в Википедии: Village pump (предложения) / Архив 126 # Черновики пользовательских страниц, отображаемые в поисковых системах , реализованы на phab: T104797 .
- ^ Это $ wgNamespaceRobotPolicies . См . Параметр $ wgNamespaceRobotPolicies Викимедиа для enwiki
- ^ Это контролируетсянастройкой программного обеспечения MediaWiki $ wgExemptFromUserRobotsControl . В других проектах освобожденные пространства имен такие же, как $ wgContentNamespaces , которое установлено как основное пространство почти во всех проектах Викимедиа - см. Здесь и здесь .
- ^ Список осуществляется MediaWiki, отслеживающим ключевое слово. Название категории определяется MediaWiki: Noindex-category .
- ^ Он переопределяет mw: Manual: $ wgArticleRobotPolicies , но в английской Википедии это все равно используется только для двух страниц: параметр Wikimedia $ wgArticleRobotPolicies для enwiki
- ^ Special: PermaLink / 862856598 # Prevent_new_users_from_allowing_search_engine_indexing_of_user_pages
- ^ Управляется $ wgNoFollowLinks , установлено значение true в файле настроек Викимедиа