Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Парсинг блогов - это процесс сканирования большого количества блогов , обычно с использованием автоматизированного программного обеспечения, поиска и копирования контента. Программное обеспечение и людей, которые его запускают, иногда называют парсерами блогов.

Парсинг блога - это копирование блога или содержимого блога, которые не принадлежат лицу, инициирующему процесс парсинга. Если материал защищен авторским правом, это считается нарушением авторских прав , за исключением случаев, когда имеется лицензия, ослабляющая авторские права, или если в стране не действует закон о добросовестном или частном использовании. Очищенный контент часто используется в спам-блогах или сплогах , такие места называются сайтами-скребками .

Проблемы [ править ]

Сборщик блогов, собирающий контент, защищенный авторским правом, может считаться нарушением закона в зависимости от случая, использования данных и страны. Очистка блога может создать проблемы для человека или компании, владеющей блогом. Очистка блогов особенно беспокоит владельцев бизнеса и бизнес-блоггеров. Скреперы могут скопировать весь пост из независимого или бизнес-блога. Дублированный контент будет включать тег автора и обратную ссылку на сайт автора (если эта ссылка присутствует в теге автора). Однако большинство парсеров блогов копируют только часть контента, релевантного ключевому слову для их темы splog. Тем самым повышается релевантность ключевого слова сайта парсера. Во-вторых, если не очищать всю публикацию, все исходящие ссылки удаляются, что означает, что ихрейтинг в поисковых системах не снижается.

Кроме того, извлеченный контент может появиться буквально на любом типе спам-сайтов или RSS- рассылок. Это означает, что ничего не подозревающий человек может обнаружить, что его творческий материал или материалы, защищенные авторским правом, скопированы на сайт, продвигающий порнографию или аналогичный тип контента, который может быть оскорбительным для первоначального автора и его / ее аудитории. Это может нанести ущерб репутации первоначального автора.

Ссылки [ править ]


Внешние ссылки [ править ]