Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Математический рейтинг страницы для простой сети выражается в процентах. (Google использует логарифмическую шкалу .) Страница C имеет более высокий PageRank, чем страница E, хотя на C меньше ссылок; одна ссылка на C происходит с важной страницы и, следовательно, имеет большую ценность. Если пользователи Интернета, которые начинают со случайной страницы, имеют 85% -ную вероятность выбора случайной ссылки со страницы, которую они в данный момент посещают, и 15% -ную вероятность перехода на страницу, выбранную случайным образом из всей сети, они попадут на страницу E 8,1% случаев. (Вероятность перехода на произвольную страницу 15% соответствует коэффициенту демпфирования85%.) Без демпфирования все пользователи сети в конечном итоге оказались бы на страницах A, B или C, а все остальные страницы имели бы нулевой PageRank. При наличии демпфирования страница A фактически ссылается на все страницы в сети, даже если у нее нет собственных исходящих ссылок.

PageRank ( PR ) - это алгоритм, используемый поиском Google для ранжирования веб-страниц в результатах поиска . PageRank - это способ измерения важности страниц веб-сайта. Согласно Google:

PageRank работает путем подсчета количества и качества ссылок на страницу, чтобы определить приблизительную оценку того, насколько важен веб-сайт. Основное предположение состоит в том, что более важные веб-сайты, вероятно, будут получать больше ссылок с других веб-сайтов. [1]

В настоящее время PageRank - не единственный алгоритм, используемый Google для упорядочивания результатов поиска, но это первый алгоритм, который использовался компанией, и он является наиболее известным. [2] [3] С 24 сентября 2019 г. истек срок действия PageRank и всех связанных патентов. [4]

Описание [ править ]

Мультфильм, иллюстрирующий основной принцип PageRank. Размер каждой грани пропорционален общему размеру других лиц, которые на нее указывают.

PageRank - это алгоритм анализа ссылок , который присваивает числовой вес каждому элементу набора документов с гиперссылками , такого как World Wide Web , с целью «измерения» его относительной важности в этом наборе. Алгоритм может быть применен к любой коллекции объектов с взаимными цитатами и ссылками. Числовой вес, который он присваивает любому заданному элементу E , называется PageRank элемента E и обозначается

Результаты PageRank из математического алгоритма , основанный на webgraph , созданный всех World Wide Web - страницах , как узлы и гиперссылка как кромки, принимая во внимание концентраторов власти , таких как cnn.com или mayoclinic.org . Значение рейтинга указывает на важность конкретной страницы. Гиперссылка на страницу считается голосом поддержки. PageRank страницы определяется рекурсивно и зависит от количества и метрики PageRank всех страниц, которые ссылаются на нее (« входящие ссылки »). Страница, на которую ссылаются многие страницы с высоким PageRank, сама получает высокий рейтинг.

После выхода оригинальной статьи Пейджа и Брина было опубликовано множество научных статей, касающихся PageRank . [5] На практике концепция PageRank может быть уязвима для манипуляций. Было проведено исследование для определения рейтинга PageRank, на который ложно повлияли. Цель состоит в том, чтобы найти эффективные средства игнорирования ссылок из документов с ложно измененным PageRank. [6]

Другие алгоритмы ранжирования на основе ссылок для веб-страниц включают алгоритм HITS, изобретенный Джоном Клейнбергом (используемый Teoma, а теперь и Ask.com ), проект IBM CLEVER , алгоритм TrustRank и алгоритм Hummingbird . [7]

История [ править ]

Проблема собственных значений была предложена в 1976 году Габриэлем Пински и Фрэнсисом Нарином, которые работали над наукометрическим рейтингом научных журналов [8], в 1977 году Томасом Саати в его концепции аналитического процесса иерархии, который взвешивал альтернативные варианты выбора, [9] и в 1995 году Брэдли. Лав и Стивен Сломан как когнитивная модель концепций, алгоритм центральности. [10] [11]

Поисковая машина под названием " RankDex " от IDD Information Services, разработанная Робином Ли в 1996 году, разработала стратегию оценки сайтов и ранжирования страниц. [12] Ли называл свой механизм поиска «анализом ссылок», который включал ранжирование популярности веб-сайта на основе того, сколько других сайтов на него ссылались. [13] RankDex, первая поисковая система с алгоритмами ранжирования страниц и рейтинга сайтов, была запущена в 1996 году. [14] Ли запатентовал технологию в RankDex, его патент был подан в 1997 году и выдан в 1999 году. [15] Позже он использовал его, когда основал Baidu в Китае в 2000 году. [16] [17] Основатель Google Ларри Пейджсослался на работу Ли как на ссылку в некоторых своих патентах США на PageRank. [18] [14] [19]

Ларри Пейдж и Сергей Брин разработали PageRank в Стэнфордском университете в 1996 году в рамках исследовательского проекта, посвященного поисковой системе нового типа. Интервью с Эктором Гарсиа-Молиной, профессором Стэнфордских компьютерных наук и советником Сергея [20], дает представление о разработке алгоритма ранжирования страниц. [21] Сергей Брин считал, что информацию в Интернете можно упорядочить в иерархии по «ссылочной популярности»: страница занимает более высокое место, поскольку на нее больше ссылок. [22] Система была разработана с помощью Скотта Хассана и Алана Стеремберга, оба из которых были названы Пейджем и Брином критически важными для развития Google. [5] Раджив Мотвани и Терри Виноград в соавторстве с Пейджем и Брином написали первый документ о проекте, описывающий PageRank и начальный прототип поисковой системы Google , опубликованный в 1998 году. [5] Вскоре после этого Пейдж и Брин основали Google Inc. , компания, стоящая за поисковой системой Google. Будучи лишь одним из многих факторов, определяющих рейтинг результатов поиска Google, PageRank продолжает служить основой для всех инструментов веб-поиска Google. [23]

Название «PageRank» играет на имени разработчика Ларри Пейджа, а также на концепции веб-страницы . [24] [25] Слово является товарным знаком Google, и процесс PageRank был запатентован ( патент США 6 285 999 ). Однако патент передан Стэнфордскому университету, а не Google. Google обладает исключительными лицензионными правами на патент Стэнфордского университета. Университет получил 1,8 миллиона акций Google в обмен на использование патента; он продал акции в 2005 году за 336 миллионов долларов. [26] [27]

На PageRank повлиял анализ цитирования , разработанный Юджином Гарфилдом в 1950-х годах в Университете Пенсильвании, и Hyper Search , разработанный Массимо Маркиори из Университета Падуи . В том же году, когда был введен PageRank (1998), Джон Клейнберг опубликовал свою работу о HITS . Основатели Google цитируют Гарфилда, Маркиори и Клейнберга в своих оригинальных статьях. [5] [28]

Алгоритм [ править ]

Алгоритм PageRank выводит распределение вероятностей, используемое для представления вероятности того, что человек, случайно щелкнувший по ссылкам, попадет на любую конкретную страницу. PageRank можно рассчитать для коллекций документов любого размера. В нескольких исследовательских работах предполагается, что распределение равномерно распределяется между всеми документами в коллекции в начале вычислительного процесса. Для вычисления PageRank требуется несколько проходов, называемых «итерациями», через коллекцию для корректировки приблизительных значений PageRank для более точного отражения теоретического истинного значения.

Вероятность выражается числовым значением от 0 до 1. Вероятность 0,5 обычно выражается как «50% -ный шанс» того, что что-то произойдет. Следовательно, документ с рейтингом страницы 0,5 означает, что существует 50% -ная вероятность того, что человек, щелкнувший случайную ссылку, будет перенаправлен на указанный документ.

Упрощенный алгоритм [ править ]

Предположим , небольшую вселенную из четырех веб - страниц: A , B , C , и D . Ссылки со страницы на саму себя игнорируются. Множественные исходящие ссылки с одной страницы на другую рассматриваются как одна ссылка. PageRank инициализируется одинаковым значением для всех страниц. В исходной форме PageRank сумма PageRank по всем страницам представляла собой общее количество страниц в Интернете на тот момент, поэтому каждая страница в этом примере будет иметь начальное значение 1. Однако более поздние версии PageRank и В оставшейся части этого раздела предположим, что распределение вероятностей находится между 0 и 1. Следовательно, начальное значение для каждой страницы в этом примере равно 0,25.

PageRank, передаваемый от данной страницы к целям ее исходящих ссылок на следующей итерации, делится поровну между всеми исходящими ссылками.

Если бы единственные ссылки в системе были со страниц B , C и D на A , каждая ссылка передала бы 0,25 PageRank в A при следующей итерации, что в сумме составит 0,75.

Предположим вместо этого, что страница B имеет ссылку на страницы C и A , страница C имеет ссылку на страницу A , а страница D имеет ссылки на все три страницы. Таким образом, после первой итерации, страница Б будет передавать половину своего существующего значения, или 0,125, на страницу A , а другая половина, или 0,125, на страницу C . Page C будет передавать все существующие значения, 0,25, к единственной странице это ссылки на, A . Поскольку у D было три исходящих ссылки, он передал бы треть своего существующего значения, или приблизительно 0,083, на A.. По завершении этой итерации страница A будет иметь рейтинг PageRank примерно 0,458.

Другими словами, PageRank, присвоенный исходящей ссылкой, равен собственной оценке PageRank документа, деленной на количество исходящих ссылок L () .

В общем случае значение PageRank для любой страницы u может быть выражено как:

,

т.е. значение PageRank для страницы u зависит от значений PageRank для каждой страницы v, содержащейся в наборе B u (набор, содержащий все страницы, ссылающиеся на страницу u ), деленных на количество L ( v ) ссылок со страницы v .

Коэффициент демпфирования [ править ]

Теория PageRank утверждает, что воображаемый пользователь, который случайно нажимает на ссылки, в конечном итоге перестанет нажимать. Вероятность на любом этапе того, что человек продолжит, является демпфирующим фактором d . В различных исследованиях были проверены различные коэффициенты демпфирования, но обычно предполагается, что коэффициент демпфирования будет установлен около 0,85. [5]

Коэффициент демпфирования вычитается из 1 (и в некоторых вариантах алгоритма результат делится на количество документов ( N ) в коллекции), а затем этот член добавляется к произведению коэффициента демпфирования и суммы входящие оценки PageRank. То есть,

Таким образом, PageRank любой страницы в значительной степени определяется рейтингом PageRank других страниц. Коэффициент демпфирования понижает производное значение. Однако в исходной статье была дана следующая формула, которая привела к некоторой путанице:

Различие между ними в том , что значения PageRank в первой формуле сумме к одному, в то время как во второй формуле каждого PageRank является умноженным на N и сумма становится N . Утверждение в статье Пейджа и Брина о том, что «сумма всех рейтингов страниц равняется единице» [5], и утверждения других сотрудников Google [29] подтверждают первый вариант приведенной выше формулы.

Пейдж и Брин перепутали две формулы в своей самой популярной статье «Анатомия крупномасштабной гипертекстовой поисковой машины в Интернете», где они ошибочно утверждали, что последняя формула формирует распределение вероятностей по веб-страницам. [5]

Google пересчитывает рейтинг PageRank каждый раз, когда просматривает Интернет и перестраивает свой индекс. По мере того как Google увеличивает количество документов в своей коллекции, начальное приближение PageRank уменьшается для всех документов.

В формуле используется модель случайного пользователя, который достигает своего целевого сайта после нескольких щелчков мышью, а затем переключается на случайную страницу. Значение PageRank страницы отражает вероятность того, что случайный пользователь попадет на эту страницу, щелкнув ссылку. Его можно понять как цепь Маркова, в которой состояниями являются страницы, а переходы - это связи между страницами, причем все они равновероятны.

Если на странице нет ссылок на другие страницы, она становится приемником и, следовательно, прекращает процесс случайного просмотра. Если случайный пользователь попадает на страницу приемника, он случайным образом выбирает другой URL и снова продолжает просмотр.

При расчете PageRank предполагается, что страницы без исходящих ссылок ссылаются на все другие страницы в коллекции. Таким образом, их рейтинг PageRank равномерно распределяется между всеми остальными страницами. Другими словами, чтобы быть справедливыми со страницами, которые не являются приемниками, эти случайные переходы добавляются ко всем узлам в сети. Эта остаточная вероятность, d , обычно устанавливается равной 0,85 и оценивается по частоте, с которой средний пользователь использует функцию закладок в своем браузере. Итак, уравнение выглядит следующим образом:

где - рассматриваемые страницы, - это набор страниц, на которые ссылаются , - это количество исходящих ссылок на странице , - это общее количество страниц.

Значения PageRank - это элементы доминирующего правого собственного вектора модифицированной матрицы смежности, масштабированные таким образом, чтобы каждый столбец составлял единицу. Это делает PageRank особенно элегантной метрикой: собственный вектор

где R - решение уравнения

где функция смежности - это отношение количества исходящих ссылок со страницы j на страницу i к общему количеству исходящих ссылок страницы j. Функция смежности равна 0, если страница не ссылается на , и нормализована так, что для каждого j

,

т.е. сумма элементов каждого столбца равна 1, поэтому матрица является стохастической матрицей (более подробную информацию см. в разделе вычислений ниже). Таким образом, это вариант меры центральности собственного вектора, обычно используемый в сетевом анализе .

Из-за большого собственного промежутка модифицированной матрицы смежности, описанной выше, [30] значения собственного вектора PageRank могут быть аппроксимированы с высокой степенью точности всего за несколько итераций.

Основатели Google в своей оригинальной статье [28] сообщили, что алгоритм PageRank для сети, состоящей из 322 миллионов ссылок (внутренних и внешних), сходится с допустимым пределом за 52 итерации. Сходимость в сети половинного размера потребовала примерно 45 итераций. На основе этих данных они пришли к выводу, что алгоритм можно очень хорошо масштабировать и что коэффициент масштабирования для чрезвычайно больших сетей будет примерно линейным , где n - размер сети.

В результате теории Маркова можно показать, что PageRank страницы - это вероятность перехода на эту страницу после большого количества кликов. Это происходит с равным , где этим ожиданием числа кликов (или случайных скачков) требуется , чтобы получить от страницы обратно к себе.

Одним из основных недостатков PageRank является то, что он отдает предпочтение более старым страницам. На новой странице, даже очень хорошей, не будет много ссылок, если она не является частью существующего сайта (сайт представляет собой плотно связанный набор страниц, такой как Википедия ).

Было предложено несколько стратегий для ускорения вычисления PageRank. [31]

Различные стратегии манипулирования PageRank были использованы в согласованных усилиях по повышению рейтинга результатов поиска и монетизации рекламных ссылок. Эти стратегии серьезно повлияли на надежность концепции PageRank, [ цитата необходима ], цель которой - определить, какие документы действительно высоко ценятся веб-сообществом.

С декабря 2007 года, когда он начал активно наказывать сайты, продающие платные текстовые ссылки, Google боролся с фермами ссылок и другими схемами, предназначенными для искусственного завышения PageRank. То, как Google определяет фермы ссылок и другие инструменты манипулирования PageRank, является коммерческой тайной Google .

Вычисление [ править ]

PageRank можно вычислить итеративно или алгебраически. Итерационный метод можно рассматривать как мощность итерационного метода [32] [33] или метод питания. Основные выполняемые математические операции идентичны.

Итеративный [ править ]

При предполагается начальное распределение вероятностей, обычно

.

где N - общее количество страниц, а это страница i в момент времени 0.

На каждом временном шаге вычисление, как описано выше, дает

где d - коэффициент демпфирования,

или в матричной записи

где и - вектор-столбец длины, содержащий только единицы.

Матрица определяется как

т.е.

,

где обозначает матрицу смежности графа, а - диагональная матрица с исходящими степенями по диагонали.

Расчет вероятности выполняется для каждой страницы в определенный момент времени, а затем повторяется для следующего момента времени. Вычисление заканчивается, когда для некоторого небольшого

,

т.е. когда предполагается сходимость.

Алгебраический [ править ]

—For (т. Е. В установившемся состоянии ) уравнение ( 1 ) имеет вид

Решение дается

,

с единичной матрицей .

Решение существует и уникально для . Это можно увидеть, отметив, что это стохастическая матрица по построению и, следовательно, имеет собственное значение, равное единице, как следствие теоремы Перрона – Фробениуса .

Метод питания [ править ]

Если матрица является вероятностью перехода, т. Е. Стохастической по столбцу, и является распределением вероятностей (т. Е. , Где - матрица всех единиц), то уравнение ( 2 ) эквивалентно

Следовательно, PageRank является главным собственным вектором . Быстрый и простой способ вычислить это - использовать степенной метод : начиная с произвольного вектора , оператор применяется последовательно, т. Е.

,

до того как

.

Обратите внимание, что в уравнении ( 3 ) матрица в правой части скобок может быть интерпретирована как

,

где - начальное распределение вероятностей. В текущем случае

.

Наконец, если есть столбцы только с нулевыми значениями, их следует заменить исходным вектором вероятности . Другими словами,

,

где матрица определяется как

,

с

В этом случае два вышеупомянутых вычисления с использованием дают один и тот же PageRank, только если их результаты нормализованы:

.

Реализация [ править ]

Scala / Apache Spark [ править ]

Типичный пример - использование функционального программирования Scala с RDD Apache Spark для итеративного вычисления ранга страницы.[34] [35]

объект  SparkPageRank  {  def  main ( args :  Array [ String ])  {  val  spark  =  SparkSession  . строитель  . appName ( "SparkPageRank" )  . getOrCreate () знач  Iters  =  если  ( арг . длина  >  1 )  арг ( 1 ). toInt  еще  10  знач  линии  =  искра . читать . текстовый файл ( аргументы ( 0 )). rdd  val  links  =  lines . карта {  s  =>  val  parts  =  s . split ( "\\ s +" )  ( части ( 0 ), части ( 1 ))  }. отличный (). groupByKey (). кеш ()  var  ranks  =  ссылки . mapValues ( v  =>  1.0 ) for  ( i  <-  1  to  iters )  {  val  contribs  =  links . вступить ( ряды ). ценности . flatMap {  case  ( urls ,  rank )  =>  val  size  =  urls . размер  URL . map ( url  =>  ( url ,  rank  /  size ))  }  ranks  =  contribs . reduceByKey( _  +  _ ). mapValues ( 0,15  +  0,85  *  _ )  } val  output  =  rank . collect ()  вывод . foreach ( tup  =>  println ( tup . _1  +  "имеет ранг:"  +  tup . _2  +  "." )) искра . stop ()  } }

MATLAB / Octave [ править ]

% Параметр M матрица смежности, где M_i, j представляет ссылку от 'j' к 'i', так что для всех 'j'% sum (i, M_i, j) = 1% Параметр d коэффициент демпфирования% Параметр v_quadratic_error квадратичная ошибка для v% Return v, вектор рангов, такой, что v_i является i-м рангом из [0, 1]функция  [v] = rank2 ( M, d, v_quadratic_error )  N = размер ( M , 2 ); % N равно любой размерности M и количеству документов.    v = rand ( N , 1 );   v = v ./ norm ( v , 1 ); % Теперь это L1, а не L2      last_v = единицы ( N , 1 ) * inf ;     M_hat = ( d . * M ) + ((( 1 - d ) / N ) . * One ( N , N ));             while ( norm ( v - last_v , 2 ) > v_quadratic_error )      last_v = v ;  v = M_hat * v ;     % удалил L2 норму повторного PRконецконец функции% 

Пример кода, вызывающего функцию ранжирования, определенную выше:

М = [ 0 0 0 0 1 ; 0,5 0 0 0 0 ; 0,5 0 0 0 0 ; 0 1 0,5 0 0 ; 0 0 0,5 1 0] ;                              ранг2 ( М , 0,80 , 0,001 )  

Python [ править ]

"" "Алгоритм PageRank с явным количеством итераций.Возвращает ------- ранжирование узлов (страниц) в матрице смежности"" "импортировать  numpy  как  npdef  pagerank ( M ,  num_iterations :  int  =  100 ,  d :  float  =  0.85 ):  "" "PageRank: алгоритм на триллион долларов. Параметры  ----------  M: матрица  смежности массива numpy, где M_i, j представляет собой ссылку от 'j' к 'i', так что для всех 'j'  sum (i, M_i, j) = 1  num_iterations: int, необязательное  количество итераций, по умолчанию 100  d: float, необязательный  коэффициент демпфирования, по умолчанию 0,85 Возвращает  -------  numpy array  вектор рангов, такой что v_i - i-ый ранг из [0, 1],  v суммируется до 1 ""»  Н  =  М . Форма [ 1 ]  v  =  нп . Случайным образом . Рандов ( N ,  1 )  v  =  v  /  пр . Linalg . Норма ( v ,  1 )  M_hat  =  ( д  *  М  +  ( 1  -  d )  /  N )  для  i  в  диапазоне ( num_iterations ): v  =  M_hat  @  v  return  vM  =  np . array ([[ 0 ,  0 ,  0 ,  0 ,  1 ],  [ 0,5 ,  0 ,  0 ,  0 ,  0 ],  [ 0,5 ,  0 ,  0 ,  0 ,  0 ],  [ 0 ,  1 ,  0,5 ,  0 ,  0 ] ,  [ 0 ,  0 ,  0.5 ,  1 ,  0]]) v  =  pagerank ( M ,  100 ,  0.85 )

Для схождения этого примера требуется ≈13 итераций.

Варианты [ править ]

PageRank неориентированного графа [ править ]

PageRank неориентированного графа статистически близко к распределению степени графа , [36] , но они , как правило , не идентичны: если вектор PageRank определено выше, и является вектором распределения степеней

где обозначает степень вершины , а - множество ребер графа, то, с , [37] показывает, что:

то есть PageRank неориентированного графа равен вектору распределения степеней тогда и только тогда, когда граф является регулярным, т. е. каждая вершина имеет одинаковую степень.

Обобщение PageRank и центральности собственного вектора для двух видов ранжирования объектов [ править ]

Обобщение PageRank на случай ранжирования двух взаимодействующих групп объектов было описано Даугулисом. [38] В приложениях может возникнуть необходимость в моделировании систем, имеющих объекты двух типов, в которых взвешенное отношение определяется на парах объектов. Это приводит к рассмотрению двудольных графов . Для таких графов могут быть определены две связанные положительные или неотрицательные неприводимые матрицы, соответствующие множествам разбиений вершин. Можно вычислить ранжирование объектов в обеих группах как собственные векторы, соответствующие максимальным положительным собственным значениям этих матриц. Нормированные собственные векторы существуют и уникальны по теореме Перрона или Перрона – Фробениуса. Пример: потребители и продукты. Относительный вес - это норма расхода продукта.

Распределенный алгоритм вычисления PageRank [ править ]

Sarma et al. описывают два распределенных алгоритма на основе случайного блуждания для вычисления PageRank узлов в сети. [39] Один алгоритм с высокой вероятностью выполняет обходы на любом графе (направленном или неориентированном), где n - размер сети и вероятность сброса ( которая называется коэффициентом демпфирования), используемая при вычислении PageRank. Они также представляют более быстрый алгоритм, который обходится в неориентированных графах. В обоих алгоритмах каждый узел обрабатывает и отправляет несколько битов за раунд, которые являются полилогарифмическими по n, размеру сети.

Панель инструментов Google [ править ]

Панель инструментов Google долго была PageRank функция , которая отображается PageRank посещаемой страницы как целое число от 0 до 10. Наиболее популярных веб - сайтов отображается в PageRank из 10. Наименее показал PageRank 0. Google не раскрывает метод , специфичный для определения значение PageRank панели инструментов, которое следует рассматривать только как приблизительное указание ценности веб-сайта. В марте 2016 года Google объявил, что больше не будет поддерживать эту функцию, и базовый API скоро перестанет работать. [40]

Рейтинг в поисковой выдаче [ править ]

Страница результатов поисковой системы (SERP) - это фактический результат, возвращаемый поисковой системой в ответ на запрос по ключевому слову. SERP состоит из списка ссылок на веб-страницы с соответствующими текстовыми фрагментами. Рейтинг веб-страницы в поисковой выдаче относится к размещению соответствующей ссылки в поисковой выдаче, где более высокое размещение означает более высокий рейтинг в выдаче. Рейтинг веб-страницы в поисковой выдаче является функцией не только ее PageRank, но и относительно большого и постоянно корректируемого набора факторов (более 200). [41] Поисковая оптимизация (SEO) направлена ​​на влияние на рейтинг в выдаче для веб-сайта или набора веб-страниц.

Позиционирование веб-страницы в выдаче Google по ключевому слову зависит от релевантности и репутации, также известных как авторитет и популярность. PageRank - это показатель Google оценки репутации веб-страницы: он не зависит от ключевого слова. Google использует комбинацию авторитета веб-страницы и веб-сайта для определения общего авторитета веб-страницы, конкурирующей за ключевое слово. [42] PageRank домашней страницы веб-сайта - лучший показатель, который Google предлагает для авторитета веб-сайта. [43]

После введения Google Places в основную органическую поисковую выдачу, множество других факторов, помимо PageRank, влияют на ранжирование бизнеса в результатах местного бизнеса. [44]

Рейтинг страниц в каталоге Google [ править ]

Каталог Google PageRank был измерение 8-блок. В отличие от панели инструментов Google, которая показывает числовое значение PageRank при наведении указателя мыши на зеленую полосу, в каталоге Google отображается только полоса, а не числовые значения. Каталог Google был закрыт 20 июля 2011 г. [45]

Ложный или поддельный PageRank [ править ]

В прошлом рейтинг страницы, отображаемый на панели инструментов, можно было легко изменить. Перенаправление с одной страницы на другую посредством ответа HTTP 302 или метатега «Обновить» заставляло исходную страницу получать PageRank целевой страницы. Следовательно, новая страница с PR 0 и без входящих ссылок могла получить PR 10 путем перенаправления на домашнюю страницу Google. Эта методика спуфинга была известной уязвимостью. Спуфинг обычно можно обнаружить, выполнив поиск в Google по URL-адресу источника; если в результатах отображается URL-адрес совершенно другого сайта, последний URL-адрес может представлять собой пункт назначения перенаправления.

Управление PageRank [ править ]

В целях поисковой оптимизации некоторые компании предлагают продавать веб-мастерам ссылки с высоким PageRank. [46] Поскольку ссылки со страниц с более высоким PR считаются более ценными, они, как правило, дороже. Покупка рекламы со ссылками на качественных содержательных и релевантных сайтах может быть эффективной и жизнеспособной маркетинговой стратегией, чтобы привлечь трафик и повысить ссылочную популярность веб-мастеров. Тем не менее, Google публично предупредил веб-мастеров, что, если они продают или будут обнаружены, что продают ссылки с целью присвоения PageRank и репутации, их ссылки будут обесценены (игнорируются при расчете PageRank других страниц). Практика покупки и продажи [47] активно обсуждается в сообществе веб-мастеров. Google советует веб-мастерам использовать значение атрибута HTML nofollow в рекламных ссылках. По словам Мэтта Каттса , Google обеспокоен тем, что веб-мастера пытаются обмануть систему и тем самым снизить качество и релевантность результатов поиска Google. [46]

Модель управляемого серфера [ править ]

Более интеллектуальный пользователь, который вероятностно перескакивает со страницы на страницу в зависимости от содержимого страниц и условий запроса пользователя, которого он ищет. Эта модель основана на зависящей от запроса оценке PageRank страницы, которая, как следует из названия, также является функцией запроса. При получении запроса с несколькими терминами пользователь выбирает элемент в соответствии с некоторым распределением вероятностей , и использует этот термин для определения своего поведения на большом количестве шагов. Затем он выбирает другой термин в соответствии с распределением, чтобы определить его поведение, и так далее. В результате распределение по посещаемым веб-страницам составляет QD-PageRank. [48]

Социальные компоненты [ править ]

Катя Майер рассматривает PageRank как социальную сеть, поскольку она объединяет различные точки зрения и мысли в одном месте. [49] Люди заходят на страницу PageRank за информацией, и их засыпают цитатами других авторов, у которых также есть мнение по данной теме. Это создает социальный аспект, где все можно обсудить и собрать, чтобы спровоцировать размышления. Между PageRank и людьми, которые его используют, существуют социальные отношения, поскольку он постоянно адаптируется и изменяется к изменениям в современном обществе. Просмотр отношений между PageRank и индивидуумом с помощью социометрии позволяет глубже взглянуть на возникающую связь.

[50] Маттео Паскинелли считает, что основание для убеждения в том, что PageRank имеет социальный компонент, лежит в идее экономии внимания.. При экономии внимания ценность придается продуктам, которые привлекают большее внимание человека, и результаты, находящиеся на вершине рейтинга PageRank, привлекают большее внимание, чем результаты на последующих страницах. Следовательно, результаты с более высоким PageRank будут в большей степени проникать в человеческое сознание. Эти идеи могут влиять на принятие решений, а действия зрителя имеют прямое отношение к PageRank. Они обладают более высоким потенциалом для привлечения внимания пользователя, поскольку их местоположение увеличивает экономию внимания, уделяемого сайту. Благодаря этому местоположению они могут получить больше трафика, а на их онлайн-рынке будет больше покупок. PageRank этих сайтов позволяет им доверять, и они могут использовать это доверие для роста бизнеса.

Другое использование [ править ]

Математика PageRank является полностью общей и применима к любому графу или сети в любом домене. Таким образом, PageRank теперь регулярно используется в библиометрии, анализе социальных и информационных сетей, а также для прогнозирования и рекомендации ссылок. Он даже используется для системного анализа дорожных сетей, а также для биологии, химии, нейробиологии и физики. [51]

Научные исследования и академия [ править ]

Pagerank недавно использовался для количественной оценки научного влияния исследователей. Базовые сети цитирования и сотрудничества используются в сочетании с алгоритмом ранжирования страниц, чтобы создать систему ранжирования для отдельных публикаций, которая распространяется на отдельных авторов. Показано, что новый индекс, известный как pagerank-index (Pi), более справедлив по сравнению с h-index в контексте многих недостатков, которые демонстрирует h-index. [52]

Для анализа белковых сетей в биологии PageRank также является полезным инструментом. [53] [54]

В любой экосистеме модифицированная версия PageRank может использоваться для определения видов, которые необходимы для постоянного здоровья окружающей среды. [55]

Аналогичное новое использование PageRank - это ранжирование академических докторских программ на основе их записей о размещении их выпускников на должности преподавателей. С точки зрения PageRank, академические отделы связываются друг с другом, нанимая своих преподавателей друг у друга (и у себя). [56]

Вариант PageRank недавно был предложен в качестве замены традиционного института научной информации (ISI) импакт - фактор , [57] и реализованы в Eigenfactor , а также на SCImago . Вместо того, чтобы просто подсчитывать общее количество цитирований в журнале, «важность» каждой цитаты определяется методом PageRank.

В нейробиологии было обнаружено , что PageRank нейрона в нейронной сети коррелирует с его относительной частотой срабатывания. [58]

Использование Интернета [ править ]

Персонализированный PageRank используется Twitter для представления пользователям других учетных записей, на которые они могут захотеть подписаться. [59]

Продукт Swiftype для поиска по сайту формирует «PageRank, специфичный для отдельных веб-сайтов», просматривая сигналы важности каждого веб-сайта и устанавливая приоритет контента на основе таких факторов, как количество ссылок с домашней страницы. [60]

Роботы могут использовать PageRank в качестве одного из нескольких метрик значения , которое он использует , чтобы определить , какой URL для посещения во время обхода полотна. Один из ранних рабочих документов [61] , которые были использованы при создании Google является эффективным сканированием через URL упорядочение , [62] , который обсуждается использование целого ряда различных показателей важности , чтобы определить , насколько глубоко и насколько сайт Google будет ползать. PageRank представлен как одна из этих метрик важности, хотя есть и другие перечисленные, такие как количество входящих и исходящих ссылок для URL-адреса и расстояние от корневого каталога на сайте до URL-адреса.

PageRank также может использоваться в качестве методологии для измерения очевидного воздействия сообщества, такого как Blogosphere, на сам Интернет в целом. Таким образом, этот подход использует PageRank для измерения распределения внимания в соответствии с парадигмой безмасштабной сети . [ необходима цитата ]

Другие приложения [ править ]

В 2005 году в пилотном исследовании в Пакистане « Структурная глубокая демократия» SD2 [63] [64] использовалась для отбора руководителей в группе устойчивого сельского хозяйства под названием «Контактная молодежь». SD2 использует PageRank для обработки транзитивных голосов по доверенности с дополнительными ограничениями, предусматривающими обязательное использование как минимум двух начальных доверенных лиц на одного избирателя, и все избиратели являются кандидатами по доверенности. На основе SD2 могут быть созданы более сложные варианты, такие как добавление специализированных доверенных лиц и прямое голосование по конкретным вопросам, но SD2 как базовая зонтичная система требует, чтобы всегда использовались универсальные прокси.

В спорте алгоритм PageRank используется для ранжирования результатов: команд Национальной футбольной лиги (НФЛ) США; [65] индивидуальные футболисты; [66] и спортсмены Бриллиантовой лиги. [67]

PageRank использовался для ранжирования мест или улиц, чтобы предсказать, сколько людей (пешеходов или транспортных средств) придут на отдельные места или улицы. [68] [69] В лексической семантике он использовался для устранения неоднозначности смысла слов , [70] семантического сходства , [71], а также для автоматического ранжирования синсетов WordNet в зависимости от того, насколько сильно они обладают данным семантическим свойством, таким как положительность или негатив. [72]

nofollow [ править ]

В начале 2005 года Google внедрила новое значение « NoFollow », [73] для отна атрибута ссылок и анкерных элементов HTML, так что разработчики сайтов и блоггеры могут сделать ссылки , которые Google не будет рассматривать для целей PageRank-они ссылки, которые больше не являются «голосом» в системе PageRank. Отношение nofollow было добавлено в попытке помочь в борьбе со спамодексированием .

Например, раньше люди могли создавать множество сообщений на досках объявлений со ссылками на свой веб-сайт, чтобы искусственно завышать свой PageRank. С помощью значения nofollow администраторы доски сообщений могут изменить свой код, чтобы автоматически вставлять rel = 'nofollow' во все гиперссылки в сообщениях, тем самым предотвращая влияние этих конкретных сообщений на PageRank. Однако этот метод предотвращения также имеет различные недостатки, такие как снижение ценности ссылки в законных комментариях. (См .: Спам в блогах # nofollow )

Пытаясь вручную контролировать поток PageRank между страницами на веб-сайте, многие веб-мастера практикуют так называемое «формирование рейтинга страниц» [74] , то есть стратегическое размещение атрибута nofollow на определенных внутренних ссылках веб-сайта с целью воронки. PageRank по отношению к тем страницам, которые веб-мастер считал наиболее важными. Эта тактика использовалась с момента появления атрибута nofollow, но может оказаться неэффективной после того, как Google объявил, что блокирование передачи PageRank с помощью nofollow не перенаправляет этот PageRank на другие ссылки. [75]

UGC [ править ]

Теперь Google использует атрибут rel UGC в HTML, который означает пользовательский контент, а значение атрибута ugc рекомендуется для ссылок в пользовательском контенте, например, в комментариях и сообщениях на форуме. [Нужна цитата.]

Прекращение поддержки рейтинга страниц на панели инструментов [ править ]

Оценка PageRank от 0 до 10, называемая "PageRank панели инструментов", когда-то была доступна для проверенных специалистов по обслуживанию сайта через интерфейс Google Webmaster Tools. Однако 15 октября 2009 г. сотрудник Google подтвердил, что компания удалила PageRank из своего раздела инструментов для веб-мастеров , заявив, что «Мы давно говорим людям, что им не следует уделять столько внимания PageRank. Многие сайты владельцы, похоже, думают, что это самый важный показатель, за которым они должны следить, что попросту неверно ". [76] Кроме того, индикатор PageRank недоступен в собственном браузере Google Chrome .

Видимый рейтинг страницы обновляется очень редко. Последний раз он обновлялся в ноябре 2013 года. В октябре 2014 года Мэтт Каттс объявил, что другого видимого обновления рейтинга страниц не будет. [77]

Несмотря на то, что PageRank панели инструментов менее важен для целей SEO , наличие обратных ссылок с более популярных веб-сайтов продолжает подталкивать веб-страницу к более высокому рейтингу в поиске. [78]

Google подробно остановился на причинах прекращения поддержки PageRank на Q&A #March и объявил ссылки и контент главными факторами ранжирования, а в октябре 2015 года RankBrain был объявлен фактором ранжирования №3, поэтому теперь Google официально подтвердил эти 3 фактора. [79]

15 апреля 2016 года Google официально отключил отображение данных PageRank на панели инструментов Google. Google объявил о своем намерении убрать оценку PageRank с панели инструментов Google несколькими месяцами ранее. [80] Google по-прежнему будет использовать рейтинг PageRank при определении ранжирования контента в результатах поиска. [81]

См. Также [ править ]

  • Неравенство внимания
  • CheiRank
  • Авторитет домена
  • EigenTrust - децентрализованный алгоритм PageRank
  • Гугл бомба
  • Google Hummingbird
  • Матрица Google
  • Google Panda
  • Google Penguin
  • Поиск Гугл
  • Алгоритм Hilltop
  • Центральность Каца - схема 1953 года, тесно связанная с рейтингом страниц
  • Создание ссылок
  • Поисковая оптимизация
  • SimRank - мера сходства между объектами на основе модели случайного серфера.
  • TrustRank
  • VisualRank - приложение Google PageRank для поиска изображений
  • Webgraph

Ссылки [ править ]

Цитаты [ править ]

  1. ^ «Факты о Google и конкуренции» . Архивировано из оригинала 4 ноября 2011 года . Проверено 12 июля 2014 .
  2. ^ Салливан, Дэнни (2007-04-26). «Что такое Google PageRank? Руководство для поисковиков и веб-мастеров» . Земля поисковой машины . Архивировано 3 июля 2016 года.
  3. ^ Каттс, Мэтт. «Алгоритмы ранжируют релевантные результаты выше» . Архивировано из оригинального 2 -го июля 2013 года . Проверено 19 октября 2015 года .
  4. ^ «US7058628B1 - Метод ранжирования узлов в связанной базе данных - Патенты Google» . Патенты Google . Архивировано 16 января 2020 года . Проверено 14 сентября 2019 года .
  5. ^ Б с д е е г Брина, S. ; Пейдж, Л. (1998). «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете» (PDF) . Компьютерные сети и системы ISDN . 30 (1–7): 107–117. CiteSeerX 10.1.1.115.5930 . DOI : 10.1016 / S0169-7552 (98) 00110-X . ISSN 0169-7552 . Архивировано (PDF) из оригинала 27 сентября 2015 года.   
  6. ^ Gyöngyi, Золтан; Берхин, Павел; Гарсия-Молина, Гектор; Педерсен, Ян (2006), «Обнаружение ссылочного спама на основе массовой оценки», Труды 32-й Международной конференции по очень большим базам данных (VLDB '06, Сеул, Корея) (PDF) , стр. 439–450, в архиве (PDF ) из оригинала от 03.12.2014 .
  7. ^ «FAQ: Все о новом алгоритме Google« Колибри »» . Земля поисковой машины . 26 сентября 2013 года. Архивировано 23 декабря 2018 года . Проверено 18 декабря 2018 .
  8. ^ Габриэль Pinski & Francis Нарин (1976). «Влияние цитирования на журнальные совокупности научных публикаций: теория с приложением к физической литературе». Обработка информации и управление . 12 (5): 297–312. DOI : 10.1016 / 0306-4573 (76) 90048-0 .
  9. ^ Томас Саати (1977). «Метод масштабирования приоритетов в иерархических структурах». Журнал математической психологии . 15 (3): 234–281. DOI : 10.1016 / 0022-2496 (77) 90033-5 . hdl : 10338.dmlcz / 101787 .
  10. ^ Брэдли С. Лав и Стивен А. Сломан. «Изменчивость и детерминанты концептуальной трансформируемости» (PDF) . Труды семнадцатой ежегодной конференции Общества когнитивных наук . С. 654–659. Архивировано (PDF) из оригинала 23 декабря 2017 года . Проверено 23 декабря 2017 .
  11. ^ «Как студент CogSci изобрел PageRank за три года до Google» . bradlove.org. Архивировано 11 декабря 2017 года . Проверено 23 декабря 2017 .
  12. Ли, Яньхун (6 августа 2002 г.). «К качественной поисковой системе». IEEE Internet Computing . 2 (4): 24–29. DOI : 10.1109 / 4236.707687 .
  13. ^ «Расцвет Baidu (это китайский язык для Google)» . Нью-Йорк Таймс . 17 сентября 2006 года архивация с оригинала на 27 июня 2019 . Проверено 16 июня 2019 .
  14. ^ a b "About: RankDex" Архивировано 25 мая 2015 г. в Wayback Machine , RankDex ; по состоянию на 3 мая 2014 г.
  15. ^ USPTO, "поисковая система гипертекстовых документов и метод" архивации 2011-12-05 в Wayback Machine , США Номер патента: 5920859, изобретатель: Yanhong Li, дата подачи: 5 февраля 1997, дата выпуска: Июль 6, 1999
  16. Гринберг, Энди, «Человек, обыгрывающий Google». Архивировано 8 марта2013 г. в Wayback Machine ,журнал Forbes , 5 октября 2009 г.
  17. ^ "About: RankDex" Архивировано 2 февраля 2012 г. на WebCite , rankdex.com.
  18. ^ «Метод ранжирования узлов в связанной базе данных» . Патенты Google. Архивировано 15 октября 2015 года . Проверено 19 октября 2015 года .
  19. ^ Altucher, Джеймс (18 марта 2011). «10 необычных вещей о Google» . Forbes . Архивировано 16 июня 2019 года . Проверено 16 июня 2019 .
  20. ^ Грег Wientjes. «Гектор Гарсиа-Молина: профессор компьютерных наук Стэнфордского университета и советник Сергея» . стр. мин. 25.45-32.50, 34.00–38.20 . Проверено 6 декабря 2019 .
  21. ^ Пейдж, Ларри, «PageRank: наведение порядка в сети» . Архивировано из оригинала 6 мая 2002 года . Проверено 11 сентября 2016 ., Стэнфордский проект цифровой библиотеки, обсуждение. 18 августа 1997 г. (архивировано 2002 г.)
  22. ^ 187-страничное исследование из Университета Граца, Австрия, заархивированное 16 января 2014 г. в Wayback Machine , включает примечание о том, что человеческий мозг также используется при определениирейтингастраницы в Google.
  23. ^ «Наши продукты и услуги» . Архивировано 23 июня 2008 года . Проверено 27 мая 2011 .
  24. ^ Дэвид тиски и Марк Малсид (2005). История Google . п. 37 . ISBN 978-0-553-80457-7.
  25. ^ "Пресс-центр Google: забавные факты" . Архивировано из оригинала на 2001-07-15.
  26. Лиза М. Кригер (1 декабря 2005 г.). «Стэнфорд зарабатывает 336 миллионов долларов на акциях Google» . Сан-Хосе Mercury News, цитируется redOrbit. Архивировано 8 апреля 2009 года . Проверено 25 февраля 2009 .
  27. ^ Ричард Брандт. «Запуск. Как Google получил свою канавку» . Стэнфордский журнал. Архивировано 10 марта 2009 года . Проверено 25 февраля 2009 .
  28. ^ a b Пейдж, Лоуренс ; Брин, Сергей ; Мотвани, Раджив ; Виноград, Терри (1999). Рейтинг цитирования PageRank: Наведение порядка в сети (Отчет). Архивировано 27 апреля 2006 года., опубликовано в виде технического отчета 29 января 1998 г.. PDF. Архивировано 18 августа 2011 г. на Wayback Machine.
  29. ^ Блог Мэтта Каттса : Прямо из Google: что вам нужно знать Архивировано 07февраля2010 г. на Wayback Machine , см. Страницу 15 его слайдов.
  30. ^ Taher Haveliwala & Сепандар Камвар (март 2003). «Второе собственное значение матрицы Google» (PDF) . Технический отчет Стэнфордского университета : 7056. arXiv : math / 0307056 . Bibcode : 2003math ...... 7056N . Архивировано (PDF) из оригинала 17 декабря 2008 года.
  31. ^ Джанна М. Дель Корсо; Антонио Гулли; Франческо Романи (2005). Быстрое вычисление PageRank с помощью разреженной линейной системы . Интернет-математика . Конспект лекций по информатике. 2 . С. 118–130. CiteSeerX 10.1.1.58.9060 . DOI : 10.1007 / 978-3-540-30216-2_10 . ISBN  978-3-540-23427-2. Архивировано 9 февраля 2014 года.
  32. ^ Arasu, А. и Новак, J. и Томкинс, А. и Томлин, J. (2002). «Вычисление PageRank и структура сети: эксперименты и алгоритмы». Труды одиннадцатой международной конференции в Интернете, плакатный трек . Брисбен, Австралия. С. 107–117. CiteSeerX 10.1.1.18.5264 . CS1 maint: multiple names: authors list (link)
  33. Перейти ↑ Massimo Franceschet (2010). «PageRank: Стоя на плечах гигантов». arXiv : 1002.2858 [ cs.IR ].
  34. ^ "Реализация Spark Page Rank | Github" . Архивировано 18 августа 2020 года . Проверено 21 марта 2020 .
  35. ^ «Понимание алгоритма Page Rank и реализации Spark | На примере» .
  36. ^ Никола Перра и Санто Фортунато; Фортунато (сентябрь 2008 г.). «Меры спектральной центральности в сложных сетях». Phys. Rev. E . 78 (3): 36107. arXiv : 0805.3322 . Bibcode : 2008PhRvE..78c6107P . DOI : 10.1103 / PhysRevE.78.036107 . PMID 18851105 . S2CID 1755112 .  
  37. ^ Винс Гролмуш (2015). «Заметка о PageRank ненаправленных графов». Письма об обработке информации . 115 (6–8): 633–634. arXiv : 1205.1960 . DOI : 10.1016 / j.ipl.2015.02.015 . S2CID 9855132 . 
  38. ^ Петерис Даугулис; Даугулис (2012). «Заметка об обобщении центральности собственного вектора для двудольных графов и приложений». Сети . 59 (2): 261–264. arXiv : 1610.01544 . DOI : 10.1002 / net.20442 . S2CID 1436859 . 
  39. ^ Атиш Дас Сарма; Анисур Рахаман Молла; Гопал Пандуранган; Эли Упфал (2015). «Быстрое распределенное вычисление PageRank». Теоретическая информатика . 561 : 113–121. arXiv : 1208.3071 . DOI : 10.1016 / j.tcs.2014.04.003 . S2CID 10284718 . 
  40. Шварц, Барри (8 марта 2016 г.). «Google подтвердил удаление PageRank панели инструментов» . Земля поисковой машины . Архивировано 10 марта 2016 года.
  41. ^ Фишкин, Рэнд ; Джефф Поллард (2 апреля 2007 г.). «Факторы ранжирования в поисковых системах - Версия 2» . seomoz.org. Архивировано 7 мая 2009 года . Проверено 11 мая 2009 года .[ ненадежный источник? ]
  42. ^ Довер, Д. Секреты поисковой оптимизации Индианаполис. Вайли. 2011 г.
  43. ^ Виникер, Д. Важность проверки ключевых слов для SEO . Эд. Шварц, М. Электронный путеводитель, том 5. News Press. С. 160–164.
  44. ^ «Ранжирование списков: Рейтинг - Справка Google Адресов» . Архивировано 26 мая 2012 года . Проверено 27 мая 2011 .
  45. ^ Google Directory # Google Directory
  46. ^ a b «Как сообщить о платных ссылках» . mattcutts.com/blog. 14 апреля 2007 года. Архивировано 28 мая 2007 года . Проверено 28 мая 2007 .
  47. ^ "Схемы ссылок Google". Архивировано 21 мая 2020 г. поссылкам Wayback Machine.
  48. Мэтью Ричардсон и Педро Домингос, A. (2001). Интеллектуальный серфер: вероятностная комбинация информации о ссылках и содержании в PageRank (PDF) . Архивировано (PDF) из оригинала 04.03.2016.
  49. ^ Майер, Катя (2009). Deep Search: Политика поиска за пределами Google, Социометрия поисковых систем . Studien Verlag.
  50. ^ Pasquinelli, Маттео (2009). Глубокий поиск: политика поиска за пределами Google, диаграмма когнитивного капитализма и рантье общего интеллекта . Studien Verlag.
  51. ^ Gleich, Дэвид Ф. (январь 2015). «Рейтинг страницы вне Интернета». SIAM Обзор . 57 (3): 321–363. arXiv : 1407.5107 . DOI : 10.1137 / 140976649 . S2CID 8375649 . 
  52. ^ Сенанаяке, Upul; Пиравинан, Махендра; Зомая, Альберт (2015). «Рейтинг PageRank-Index: выходя за рамки количества цитирований в количественной оценке научного воздействия исследователей» . PLOS ONE . 10 (8): e0134794. Bibcode : 2015PLoSO..1034794S . DOI : 10.1371 / journal.pone.0134794 . ISSN 1932-6203 . PMC 4545754 . PMID 26288312 .   
  53. ^ Г. Иван и В. Грольмуш (2011). «Когда Интернет встречается с клеткой: использование персонализированного PageRank для анализа сетей взаимодействия белков» . Биоинформатика . 27 (3): 405–7. DOI : 10.1093 / биоинформатики / btq680 . PMID 21149343 . Архивировано 18 февраля 2012 года. 
  54. ^ Д. Banky и Г. И. и В. Grolmusz (2013). «Равные возможности для сетевых узлов низкого уровня: основанный на PageRank метод для идентификации целевого белка в метаболических графах» . PLOS ONE . 8 (1): 405–7. Bibcode : 2013PLoSO ... 854204B . DOI : 10.1371 / journal.pone.0054204 . PMC 3558500 . PMID 23382878 .  
  55. Бернс, Джудит (04.09.2009). «Уловка Google отслеживает вымирания» . BBC News . Архивировано 12 мая 2011 года . Проверено 27 мая 2011 .
  56. ^ Бенджамин М. Шмидт и Мэтью М. Чингос (2007). «Ранжирование докторских программ по размещению: новый метод» (PDF) . PS: Политология и политика . 40 (июль): 523–529. CiteSeerX 10.1.1.582.9402 . DOI : 10.1017 / s1049096507070771 . Архивировано (PDF) из оригинала 13 февраля 2015 года.  
  57. ^ Йохан Bollen, Марко А. Родригес, и Херберт Ван Де Сомпел .; Родригес; Ван де Сомпель (декабрь 2006 г.). Статус журнала . Наукометрия . 69 . С. 669–687. arXiv : cs.GL/0601030 . Bibcode : 2006cs ........ 1030B . DOI : 10.1145 / 1255175.1255273 . ISBN 9781595936448. S2CID  3115544 .CS1 maint: multiple names: authors list (link)
  58. ^ Флетчер, Джек Маккей и Веннекерс, Томас (2017). «От структуры к активности: использование мер центральности для прогнозирования нейронной активности». Международный журнал нейронных систем . 28 (2): 1750013. DOI : 10,1142 / S0129065717500137 . PMID 28076982 . CS1 maint: multiple names: authors list (link)
  59. ^ Гупта, Панкадж; Гоэль, Ашиш; Лин, Джимми; Шарма, Аниш; Ван, Донг; Заде, Реза (2013). «WTF: Служба поддержки в Twitter» . Материалы 22-й Международной конференции по всемирной паутине . ACM. С. 505–514. DOI : 10.1145 / 2488388.2488433 . ISBN 9781450320351. S2CID  207205045 . Проверено 11 декабря 2018 .
  60. ^ Ха, Энтони (2012-05-08). «Swiftype, поддерживаемый Y Combinator, создает неудовлетворительный поиск по сайту» . TechCrunch . Архивировано 6 июля 2014 года . Проверено 8 июля 2014 .
  61. ^ «Рабочие документы, касающиеся создания Google» . Google . Архивировано 28 ноября 2006 года . Проверено 29 ноября 2006 года .
  62. Перейти ↑ Cho, J., Garcia-Molina, H., and Page, L. (1998). «Эффективное сканирование посредством упорядочивания URL» . Материалы седьмой конференции по всемирной паутине . Брисбен, Австралия. Архивировано 3 июня 2008 года.CS1 maint: multiple names: authors list (link)
  63. ^ "Yahoo! Группы" . Groups.yahoo.com. Архивировано 4 октября 2013 года . Проверено 2 октября 2013 .
  64. ^ "CiteSeerX - Автопоэтические информационные системы в современных организациях". CiteSeerX 10.1.1.148.9274 .  Cite journal requires |journal= (help)
  65. ^ Зак, Лори; Лэмб, Рон; Болл, Сара (31 декабря 2012). «Приложение Google PageRank к рейтингам НФЛ» . Вовлекайте, журнал математики . 5 (4): 463–471. DOI : 10,2140 / involve.2012.5.463 . ISSN 1944-4184 . 
  66. ^ Пенья, Хавьер Лопес; Тушетт, Хьюго (2012-06-28). «Сетевая теория анализа футбольных стратегий». arXiv : 1206.6904 [ math.CO ].
  67. ^ Беггс, Клайв Б.; Шеперд, Саймон Дж .; Эммондс, Стейси; Джонс, Бен (2017-06-02). Чжоу, Вэй-Син (ред.). «Новое приложение алгоритмов PageRank и пользовательских предпочтений для оценки относительных результатов спортсменов-бегунов на соревнованиях» . PLOS ONE . 12 (6): e0178458. Bibcode : 2017PLoSO..1278458B . DOI : 10.1371 / journal.pone.0178458 . ISSN 1932-6203 . PMC 5456068 . PMID 28575009 .   
  68. ^ Б. Цзян (2006). «Пространства ранжирования для прогнозирования движения человека в городской среде». Международный журнал географической информатики . 23 (7): 823–837. arXiv : физика / 0612011 . Bibcode : 2006physics..12011J . DOI : 10.1080 / 13658810802022822 . S2CID 26880621 . 
  69. ^ Цзян Б .; Чжао С. и Инь Дж. (2008). «Самоорганизованные естественные дороги для прогнозирования транспортного потока: исследование чувствительности». Журнал статистической механики: теория и эксперимент . P07008 (7): 008. arXiv : 0804.1630 . Bibcode : 2008JSMTE..07..008J . DOI : 10.1088 / 1742-5468 / 2008/07 / P07008 . S2CID 118605727 . 
  70. ^ Роберто Навильи, Мирелла Лапата. «Экспериментальное исследование связности графов для неконтролируемого устранения неоднозначности слов». Архивировано 14 декабря 2010 г. в Wayback Machine . IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 32 (4), IEEE Press, 2010, pp. 678–692.
  71. ^ MT Пилехвар, Д. Юргенс и Р. Навильи. Выровнять, устранить неоднозначность и пройти: единый подход к измерению семантического сходства. Архивировано 1 октября 2013 года на Wayback Machine . Proc. 51-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2013), София, Болгария, 4–9 августа 2013 г., стр. 1341-1351.
  72. ^ Андреа Эсули и Фабрицио Себастьяни. «Рейтинги страниц в WordNet: приложение к свойствам, связанным с мнениями» (PDF) . В материалах 35-го заседания Ассоциации компьютерной лингвистики, Прага, Чехия, 2007 г., стр. 424–431 . Архивировано 28 июня 2007 года (PDF) . Проверено 30 июня 2007 года .
  73. ^ «Предотвращение спама в комментариях» . Google . Архивировано 12 июня 2005 года . Проверено 1 января 2005 года .
  74. ^ «Создание PageRank: Анализ ценности и потенциальных преимуществ формирования PR с помощью Nofollow» . SEOmoz. Архивировано 14 мая 2011 года . Проверено 27 мая 2011 .
  75. ^ "Скульптура PageRank" . Mattcutts.com. 2009-06-15. Архивировано 11 мая 2011 года . Проверено 27 мая 2011 .
  76. ^ Сьюзан Москва. «Распределение рейтинга страниц удалено из WMT» . Архивировано 17 октября 2009 года . Проверено 16 октября 2009 года .
  77. ^ БАРТЛЕМАН, Виль (2014-10-12). "Обновление рейтинга страницы Google не происходит" . Управляемый админ. Архивировано 2 апреля 2015 года . Проверено 12 октября 2014 .
  78. ^ "Итак ... Вы думаете, что SEO изменилось" . 19 марта 2014 года. Архивировано 31 марта 2014 года.
  79. ^ Кларк, Джек. "Google превращает свой прибыльный веб-поиск в машины искусственного интеллекта" . Блумберг. Архивировано 25 марта 2016 года . Проверено 26 марта 2016 года .
  80. ^ Шварц, Барри. "Google Toolbar PageRank официально теряет значение" . Земля поисковой машины . Архивировано 21 апреля 2016 года.
  81. ^ Южный, Мэтт (2016-04-19). «Google PageRank официально закрывает двери для публики» . Журнал поисковых систем . Архивировано 13 апреля 2017 года.

Источники [ править ]

  • Альтман, Алон; Моше Тенненхольц (2005). "Системы ранжирования: Аксиомы PageRank" (PDF) . Материалы 6-й конференции ACM по электронной коммерции (EC-05) . Ванкувер, Британская Колумбия . Проверено 29 сентября 2014 года .
  • Ченг, Алиса; Эрик Дж. Фридман (11 июня 2006 г.). «Управляемость PageRank в стратегиях Sybil» (PDF) . Труды Первого семинара по экономике сетевых систем (NetEcon06) . Анн-Арбор, Мичиган. Архивировано (PDF) из оригинала 21.08.2010 . Проверено 22 января 2008 .
  • Фарахат, Айман; ЛоФаро, Томас; Миллер, Джоэл С .; Рэй, Грегори; Уорд, Лесли А. (2006). «Рейтинг авторитета на основе HITS, PageRank и SALSA: существование, уникальность и эффект инициализации». Журнал СИАМ по научным вычислениям . 27 (4): 1181–1201. CiteSeerX  10.1.1.99.3942 . DOI : 10,1137 / S1064827502412875 .
  • Хавеливала, Тахер; Джех, Глен; Камвар, Сепандар (2003). «Аналитическое сравнение подходов к персонализации PageRank» (PDF) . Технический отчет Стэнфордского университета . Архивации (PDF) с оригинала на 2010-12-16 . Проверено 13 ноября 2008 .
  • Лэнгвилл, Эми Н .; Мейер, Карл Д. (2003). «Обзор: глубже изнутри PageRank». Интернет-математика . 1 (3).
  • Лэнгвилл, Эми Н .; Мейер, Карл Д. (2006). PageRank Google и за его пределами: наука о рейтинге в поисковых системах . Издательство Принстонского университета. ISBN 978-0-691-12202-1.
  • Ричардсон, Мэтью; Домингос, Педро (2002). «Интеллектуальный пользователь: вероятностная комбинация информации о ссылках и содержании в PageRank» (PDF) . Труды о достижениях в системах обработки нейронной информации . 14 . Архивировано (PDF) из оригинала 28.06.2010 . Проверено 18 сентября 2004 .

Соответствующие патенты [ править ]

  • Исходный патент США PageRank - Метод ранжирования узлов в связанной базе данных - Патент № 6 285 999 - 4 сентября 2001 г.
  • PageRank Патент США - Метод оценки документов в связанной базе данных - Патент № 6 799 176 - 28 сентября 2004 г.
  • PageRank Патент США - Метод ранжирования узлов в связанной базе данных - Патент № 7 058 628 - 6 июня 2006 г.
  • PageRank Патент США - Оценка документов в связанной базе данных - Патент № 7 269 587 - 11 сентября 2007 г.

Внешние ссылки [ править ]

  • Алгоритмы от Google
  • Наши продукты и услуги от Google
  • Как Google находит вашу иголку в стоге сена Интернета, Американское математическое общество

(Google использует логарифмическую шкалу.)