Дублированный контент - это термин, используемый в области поисковой оптимизации для описания контента, который появляется на нескольких веб-страницах. Дублированный контент может быть существенной частью контента внутри доменов или между доменами и может быть либо полностью дублированным, либо очень похожим. [1] Когда несколько страниц содержат, по сути, один и тот же контент, поисковые системы, такие как Google и Bing, могут оштрафовать или прекратить отображение копируемого сайта в любых релевантных результатах поиска.
Типы
Не злонамеренный
Неумышленное дублированное содержимое может включать в себя варианты одной и той же страницы, например версии, оптимизированные для обычного HTML, мобильных устройств или удобство для печати, или элементы магазина, которые могут отображаться через несколько разных URL-адресов. [1] Проблемы с дублированием контента также могут возникнуть, когда сайт доступен из нескольких поддоменов, например, с www или без него. или где сайты не могут правильно обрабатывать завершающую косую черту URL-адресов. [2] Еще одним распространенным источником не вредоносного дублированного контента является разбиение на страницы , при котором контент и / или соответствующие комментарии разделены на отдельные страницы. [3]
Синдицированный контент - это популярная форма дублированного контента. Если сайт синдицирует контент с других сайтов, обычно считается важным убедиться, что поисковые системы могут определить, какая версия контента является оригинальной, чтобы оригинал мог получить преимущества более широкого распространения через результаты поисковой системы. [1] Это можно сделать с помощью тега rel = canonical на синдицированной странице, указывающего на оригинал, без индексации синдицированной копии или размещения ссылки в синдицированной копии, которая ведет обратно к исходной статье. Если ни одно из этих решений не будет реализовано, синдицированную копию можно будет рассматривать как оригинал и получить преимущества. [4]
Количество возможных URL-адресов, создаваемых серверным программным обеспечением, также затрудняло поисковым роботам возможность получения дублированного контента . Существуют бесконечные комбинации параметров HTTP GET (на основе URL), из которых только небольшой выбор действительно вернет уникальный контент. Например, простая онлайн-фотогалерея может предлагать пользователям три варианта, как указано в параметрах HTTP GET в URL-адресе. Если существует четыре способа сортировки изображений, три варианта размера миниатюр , два формата файлов и возможность отключения содержимого, предоставленного пользователем, то к одному и тому же набору содержимого можно получить доступ с помощью 48 разных URL-адресов, на все из которых можно ссылаться сайт. Эта математическая комбинация создает проблему для поисковых роботов, поскольку они должны сортировать бесконечные комбинации относительно незначительных изменений сценария, чтобы получить уникальный контент.
Вредоносный
Вредоносный дублированный контент - это контент, который намеренно дублируется с целью манипулирования результатами поиска и увеличения трафика. Это называется поисковым спамом . Существует ряд инструментов для проверки уникальности контента. [5] В некоторых случаях поисковые системы наказывают веб-сайты и отдельные страницы-нарушители на страницах результатов поисковых систем (SERP) за дублированный контент, который считается «спамом».
Резолюции
Если контент был скопирован, обеим сторонам доступно несколько разрешений. [6]
- Удалите контент с сайта копировального аппарата, связавшись с владельцем дублированного контента и попросив его удалить скопированный контент.
- Нанять адвоката, чтобы отправить копировальному аппарату уведомление об удалении.
- Перепишите контент, чтобы он снова стал уникальным.
HTTP 301 редирект (301 перемещено) представляет собой метод борьбы с дублированием контента для перенаправления пользователей и поисковых роботов к одной версии соответствующего содержания. [1]
Смотрите также
Рекомендации
- ^ a b c d «Повторяющийся контент» . Google . Проверено 7 января 2016 .
- ^ «Дублированный контент - повторяющийся контент» . Проверено 19 декабря 2011 .
- ^ «Повторяющееся содержание: причинно-следственная связь и значение» . Эффективный рост бизнеса . Дата обращения 15 мая 2017 .
- ^ Энге, Эрик (28 апреля 2014 г.). «Синдицированный контент: почему, когда и как» . Земля поисковой машины . Третья дверь СМИ . Проверено 25 июня 2018 года .
- ^ Ахмад, Билал (20 мая 2011 г.). «6 бесплатных инструментов для проверки дублированного контента» . TechMaish.com . Дата обращения 15 мая 2017 .
- ^ «Есть дублирующийся контент? Это может убить ваш рейтинг» . OrangeFox.com . OrangeFox . Проверено 27 марта 2016 года .