Из Википедии, бесплатной энциклопедии
  (Перенаправлено из Википедии: ИНДЕКСИНГ )
Перейти к навигации Перейти к поиску

Существует множество способов, которыми Википедия пытается контролировать индексацию поисковой системы , обычно называемую в Википедии «неиндексированием». По умолчанию страницы индексируются. Все методы основаны на использовании метатега noindex HTML , который сообщает поисковым системам не индексировать определенные страницы. Соблюдение тега, особенно с точки зрения удаления уже проиндексированного контента, зависит от отдельной поисковой системы, и теоретически тег может быть полностью проигнорирован.

Методы контроля:

  1. Управление всем пространством имен через настройки программного обеспечения MediaWiki
  2. Управление классов страниц, с помощью MediaWiki: Robots.txt (Википедия Robots.txt файл)
  3. Управление отдельными страницами путем добавления к ним __NOINDEX__ волшебного слова либо напрямую, либо с помощью шаблона {{ NOINDEX }}, однако статьи - это особый случай, см. # Индексирование статей ("mainspace") .
  4. Управление несколькими страницами путем добавления __NOINDEX__волшебного слова в стандартные шаблоны, используемые в определенных ситуациях (та же оговорка, что и в третьем пункте);

Индексирование статей ("mainspace") [ править ]

Статьи старше 90 дней индексируются автоматически. [1]__NOINDEX__ слово магия и {{ NOINDEX }} шаблон не работать на них. Статьи младше 90 дней не индексируются, если они не прошли патрулирование и не содержат шаблон {{ NOINDEX }} (или шаблон, включающий шаблон {{ NOINDEX }}, например шаблоны быстрого удаления). [2] [3] [4]__NOINDEX__ волшебное слово делает не работать на них. Обратите внимание, что & action = info неверно указывает, что они проиндексированы. [5] Статьи, содержащие шаблон {{ NOINDEX }}, перечислены по адресуКатегория: Статьи без индексации .

Это патрулирование может выполняться автоматически программным обеспечением, как в случае статей, созданных редакторами с правом пользователя с автоматическим патрулированием , или другим редактором с правом пользователя нового рецензента страницы (не путать с правом пользователя рецензента ожидающих изменений ).

Другие пространства имен и robots.txt [ править ]

Управление пространством имен [ править ]

На английской Википедии вся User:[6] пространство имен , User talk:, Draft:и Draft talk:пространство имен автоматически noindexed через настройку программного обеспечения. [7]

В то же время __NOINDEX__и __INDEX__отключены, помимо пространства статей , в пространстве имен Draft и пространстве имен Draft talk; они там не действуют. [8]

Неиндексирование robots.txt [ править ]

MediaWiki: Robots.txt запрещает аналитическим инструментам посещать конфиденциальные или потенциально конфиденциальные типы страниц, в первую очередь в пространстве имен Википедии - например, дискуссии об удалении . Побочный эффект непосещения обычно заключается в том, что страницу нельзя проиндексировать. По возможности вы должны дополнительно использовать __NOINDEX__ для этих страниц.

Волшебное слово NOINDEX [ править ]

Отдельные страницы [ править ]

Отдельные страницы можно не проиндексировать, добавив __NOINDEX__ волшебное слово на эту страницу напрямую или с помощью шаблона {{ NOINDEX }}. Как объяснялось выше, это волшебное слово не работает в основном пространстве (в статьях).

Страницы с ключевым словом перечислены в Категория: Неиндексированные страницы . [9]

Стандартный шаблон noindexing [ править ]

Некоторые стандартные шаблоны включают __NOINDEX__ключевое слово, тем самым не индексируя страницы, к которым применяются шаблоны. Такие шаблоны должны быть перечислены в Категории: шаблоны Википедии, в которых применяется NOINDEX .

Неиндексируемая страница обсуждения биографий живых людей [ править ]

Шаблоны {{ BLP }} и {{ BLP others }} включают параметр {{ NOINDEX }}. Шаблон {{ BLP }} автоматически добавляется шаблоном страницы обсуждения {{ WikiProject Biography }}, если задан параметр |living=yes; см. документацию к этому шаблону для получения более подробной информации. Страницы, использующие эти шаблоны, автоматически попадают в категорию « Категория: Биографические статьи живых людей» .

Другие шаблоны [ править ]

Эти шаблоны включают {{ NOINDEX }}:

  • {{ Тестовая среда пользователя }}, {{ Проект пользовательского пространства }}
  • {{ Sockpuppet }}, {{ Sockpuppeteer }}, {{ IPsock }}, {{ Banned user }}, {{ Blocked user }} и другие
  • {{ Db-meta }} и {{ Deletable file }}, а также различные шаблоны быстрого удаления, созданные на его основе
  • {{ Prod blp }}

См. Также Категория: шаблоны Википедии, в которых применяется NOINDEX .

  • {{ Uw-userspacenoindex }} предоставляет пользователю предупреждающее сообщение о ненадлежащем использовании пользовательского пространства, которое не требует индексации.

Волшебное слово INDEX [ править ]

Отдельные страницы [ править ]

Отдельные страницы могут переопределить noindexing пространств имен, добавив __INDEX__ волшебное слово на эту страницу, либо напрямую, либо с помощью шаблона {{ INDEX }}. Такие страницы появляются в Категории: Проиндексированные страницы . Однако INDEX не отменяет noindexing через MediaWiki: Robots.txt . [10] Как объяснялось выше, это волшебное слово не работает в основном пространстве (в статьях).

Возможность добавления волшебного слова ИНДЕКС в пользовательские области (Пользователь :, Обсуждение пользователей :) была ограничена фильтром редактирования для расширенных подтвержденных пользователей после обсуждения в сообществе. [11]

HTML-атрибут Nofollow [ править ]

С 2007 года для всех ссылок на другие сайты из английской Википедии установлен атрибут HTML nofollow . [12] Это означает, что на страницах, которые индексируются поисковыми системами, любые ссылки, найденные поисковой системой на этих страницах, не должны влиять на рейтинг целевой ссылки в индексе поисковой системы.

Прошлые обсуждения [ править ]

Обсуждения пространств имен [ править ]

  • Википедия: Запросы на комментарии / Индексирование страницы пользователя
  • Википедия: Индексирование поисковой системой - Предложение изменить настройки пространства имен для индексации
  • Википедия: NOINDEX из доски объявлений - Мертвый / спорно предложение NOINDEX доски объявлений
  • Википедия: Деревенский насос (предложения) / Архив 35 # Пространства имен в Robot.txt - Предложение не индексировать несколько непонятных пространств имен, таких как « Обсуждение изображений». Сильное большинство выступило против.
  • Википедия: Деревенский насос (предложения) / Архив 36 # Повторно включить поиск в пространстве для разговоров пользователей - Предложение переиндексировать страницы обсуждений пользователей. Большинство против.
  • Википедия: Village pump (policy) / Archive 59 # NOINDEX всех пространств имен, не относящихся к содержанию - Смешанное обсуждение для исключения из индексации всех пространств имен, не относящихся к содержанию.
  • Википедия: Деревенский насос (политика) / Архив 62 # Где и когда использовать NOINDEX для удаления страниц из поисковых систем - Предложение исключить определенные страницы из индексации.
  • Википедия: страницы обсуждения, не проиндексированные Google - предложение сообщить Google не индексировать пространство имен Talk :.
  • Википедия: Запросы на комментарий / NOINDEX - Предложение NOINDEX о непатрулированных новых статьях и статьях с определенными шаблонами удаления.
  • Википедия: Village pump (предложения) / Архив 126 # Черновики пользовательских страниц отображаются в поисковых системах по умолчанию без индексации.

Обсуждения отдельных шаблонов [ править ]

  • Обсуждение шаблона: Несвободные медиа # Добавление NOINDEX - Предложение к NOINDEX несвободным изображениям. Нет единого мнения.
  • Обсуждение шаблона: WikiProject Biography / Archive 5 # Noindex - Предложение к шаблону страницы обсуждения NOINDEX BLP
  • Обсуждение шаблона: доска объявлений администраторов navbox all - NOINDEX в шаблоне архивов AN

Текущие проблемы [ править ]

  • T26169 / phab: T24251 - «Создать __NOINDEX__аналог, чтобы предотвратить индексацию внутренней поисковой системой»

Заметки [ править ]

  1. ^ 2017 переход с 30 на 90 дней
  2. ^ T147544
  3. ^ Исходный код PageTriage
  4. ^ Значение $ wgRCMaxAge на вики WMF
  5. ^ См. T157747
  6. ^ Решено в Википедии: Village pump (предложения) / Архив 126 # Черновики пользовательских страниц, отображаемые в поисковых системах , реализованы на phab: T104797 .
  7. ^ Это $ wgNamespaceRobotPolicies . См . Параметр $ wgNamespaceRobotPolicies Викимедиа для enwiki
  8. ^ Это контролируетсянастройкой программного обеспечения MediaWiki $ wgExemptFromUserRobotsControl . В других проектах освобожденные пространства имен такие же, как $ wgContentNamespaces , которое установлено как основное пространство почти во всех проектах Викимедиа - см. Здесь и здесь .
  9. ^ Список осуществляется MediaWiki, отслеживающим ключевое слово. Название категории определяется MediaWiki: Noindex-category .
  10. ^ Он переопределяет mw: Manual: $ wgArticleRobotPolicies , но в английской Википедии это все равно используется только для двух страниц: параметр Wikimedia $ wgArticleRobotPolicies для enwiki
  11. ^ Special: PermaLink / 862856598 # Prevent_new_users_from_allowing_search_engine_indexing_of_user_pages
  12. ^ Управляется $ wgNoFollowLinks , установлено значение true в файле настроек Викимедиа