Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В теории графов , А коэффициент кластеризации является мерой степени , в которой узлы в графе имеют тенденцию группироваться вместе. Факты свидетельствуют о том, что в большинстве реальных сетей и, в частности, в социальных сетях узлы имеют тенденцию создавать тесно связанные группы, характеризующиеся относительно высокой плотностью связей; эта вероятность имеет тенденцию быть больше, чем средняя вероятность связи, случайно установленной между двумя узлами (Holland and Leinhardt, 1971; [1] Watts and Strogatz, 1998 [2] ).

Существуют две версии этой меры: глобальная и локальная. Глобальная версия была разработана, чтобы дать общее представление о кластеризации в сети, тогда как локальная версия дает представление о встроенности отдельных узлов.

Коэффициент локальной кластеризации [ править ]

Пример коэффициента локальной кластеризации на неориентированном графе. Коэффициент локальной кластеризации синего узла вычисляется как доля фактически реализованных соединений между его соседями по сравнению с количеством всех возможных соединений. На рисунке синий узел имеет трех соседей, между которыми может быть максимум 3 соединения. В верхней части рисунка реализованы все три возможных соединения (толстые черные сегменты), что дает коэффициент локальной кластеризации, равный 1. В средней части рисунка реализовано только одно соединение (толстая черная линия) и 2 соединения отсутствуют ( пунктирные красные линии), что дает коэффициент локального кластера 1/3. Наконец, ни одно из возможных соединений между соседями синего узла не реализуется, в результате чего значение коэффициента локальной кластеризации равно 0.

Локальный коэффициент кластеризации из вершины (узла) в графе квантифицирует , насколько близко его соседи должны быть кликой (полный граф). Дункан Дж. Уоттс и Стивен Строгац ввели эту меру в 1998 году, чтобы определить, является ли граф сетью небольшого мира .

Граф формально состоит из набора вершин и набора ребер между ними. Ребро соединяет вершину с вершиной .

Окрестности для вершины определяются как его сразу связанными соседи следующим образом :

Мы определяем как количество вершин в окрестности вершины.

Коэффициент локальной кластеризации для вершины тогда определяется пропорцией связей между вершинами в ее окрестности, деленной на количество связей, которые могут существовать между ними. Для ориентированного графа, отличен от , и поэтому для каждой окрестности существуют связи, которые могут существовать между вершинами в пределах окрестности ( количество соседей вершины). Таким образом, коэффициент локальной кластеризации для ориентированных графов задается как [2]

Неориентированный граф обладает свойством и считается идентичным. Следовательно, если у вершины есть соседи, ребра могут существовать среди вершин в пределах окрестности. Таким образом, коэффициент локальной кластеризации для неориентированных графов можно определить как

Позвольте быть количество треугольников на для неориентированного графа . То есть это количество подграфов с 3 ребрами и 3 вершинами, одна из которых есть . Позвольте быть количество троек на . То есть, это число подграфов (не обязательно индуцируется) с 2 - мя ребрами и вершинами 3, один из которых является и такое , что падает на обоих краях. Тогда мы также можем определить коэффициент кластеризации как

Легко показать, что два предыдущих определения одинаковы, поскольку

Эти меры равны 1, если каждый подключенный сосед также подключен к любой другой вершине в пределах окрестности, и 0, если ни одна из подключенных вершин не соединяется с какой-либо другой вершиной, с которой связана .

Поскольку любой граф полностью определяется своей матрицей смежности A , коэффициент локальной кластеризации для простого неориентированного графа можно выразить через A как: [3]

куда:

и C i = 0, когда k i равно нулю или единице. В приведенном выше выражении числитель считает вдвое больше числа полных треугольников, в которые входит вершина i . В знаменателе k i 2 подсчитывает количество пар ребер, в которые вовлечена вершина i , плюс количество одиночных ребер, пройденных дважды. k i - количество ребер, соединенных с вершиной i, и вычитая k iзатем удаляет последний, оставляя только набор пар ребер, которые предположительно можно было бы соединить в треугольники. Для каждой такой пары ребер будет другая пара ребер, которая могла бы образовать тот же треугольник, поэтому знаменатель учитывает удвоенное количество мыслимых треугольников, в которые может входить вершина i .

Глобальный коэффициент кластеризации [ править ]

Глобальный коэффициент кластеризации основан на триплетах узлов. Тройка - это три узла, которые связаны двумя (открытая тройка) или тремя (закрытая тройка) неориентированными связями. Треугольник график , следовательно , включает в себя три замкнутые триплетов, один сосредоточены на каждом из узлов ( NB Это означает , что три триплеты в треугольнике происходят из перекрывающихся выбора узлов). Глобальный коэффициент кластеризации - это количество замкнутых триплетов (или трех треугольников) по общему количеству триплетов (как открытых, так и закрытых). Первую попытку измерить это сделали Люс и Перри (1949). [4]Эта мера дает представление о кластеризации во всей сети (глобальной) и может применяться как к ненаправленным, так и к направленным сетям (часто называемая транзитивностью, см. Вассерман и Фауст, 1994, стр. 243 [5] ).

Глобальный коэффициент кластеризации определяется как:

.

Количество замкнутых троек в литературе также называют треугольниками 3 ×, поэтому:

.

Обобщение для взвешенных сетей было предложено Opsahl и Panzarasa (2009), [6], а новое определение двухмодовых сетей (как двоичных, так и взвешенных) - Opsahl (2009). [7]

Поскольку любой граф полностью определяется своей матрицей смежности A , глобальный коэффициент кластеризации для неориентированного графа может быть выражен через A как:

куда:

и C = 0, когда знаменатель равен нулю.

Средний сетевой коэффициент кластеризации [ править ]

В качестве альтернативы глобальному коэффициенту кластеризации общий уровень кластеризации в сети измеряется Уоттсом и Строгацем [2] как среднее значение локальных коэффициентов кластеризации всех вершин  : [8]

Стоит отметить, что эта метрика придает больший вес узлам с низкой степенью, в то время как коэффициент транзитивности придает больший вес узлам с высокой степенью.

Граф считаются малым миром , если граф имеет небольшую среднюю-короткую длину пути , что весы с натуральным логарифмом числа узлов в сети, . [9] Например, случайный граф - это маленький мир, а решетка - нет, а графы без масштабирования часто считаются сверхмалыми мирами, так как их длина среднего кратчайшего пути масштабируется с .

Обобщение на взвешенные сети было предложено Barrat et al. (2004), [10] и новое определение двудольных графов (также называемых двухмодовыми сетями) Latapy et al. (2008) [11] и Opsahl (2009). [7]

Альтернативные обобщения взвешенных и ориентированных графов были предоставлены Фаджиоло (2007) [12] и Клементе и Грасси (2018). [13]

Эта формула по умолчанию не определена для графов с изолированными вершинами; см. Kaiser (2008) [14] и Barmpoutis et al. [15] Сети с максимально возможным средним коэффициентом кластеризации имеют модульную структуру и в то же время имеют минимально возможное среднее расстояние между различными узлами. [15]

Перколяция кластерных сетей [ править ]

Для исследования устойчивости кластерных сетей разработан перколяционный подход. [16] [17] [18] Устойчивость к локальным атакам была изучена с использованием локальной перколяции. [19] Также изучалась локализация волн в кластерных сложных сетях. [20]

См. Также [ править ]

  • Направленный граф
  • Теория графов
  • Теория сети
  • Сетевая наука
  • Теория перколяции
  • Сеть без масштабирования
  • Маленький мир

Ссылки [ править ]

  1. Перейти ↑ PW Holland & S. Leinhardt (1971). «Транзитивность в структурных моделях малых групп». Сравнительные групповые исследования . 2 (2): 107–124. DOI : 10.1177 / 104649647100200201 .
  2. ^ a b c Д. Дж. Уоттс и Стивен Строгац (июнь 1998 г.). «Коллективная динамика сетей« маленького мира »». Природа . 393 (6684): 440–442. Bibcode : 1998Natur.393..440W . DOI : 10.1038 / 30918 . PMID 9623998 . 
  3. ^ Ван, Ю; Гумаре, Эшвар; Ванденберге, Рик; Дюпон, Патрик (2017). «Сравнение различных обобщений коэффициента кластеризации и локальной эффективности для взвешенных неориентированных графов» . Нейронные вычисления . 29 (2): 313–331. DOI : 10.1162 / NECO_a_00914 . Проверено 8 августа 2020 года .
  4. ^ RD Luce & AD Perry (1949). «Метод матричного анализа структуры группы». Психометрика . 14 (1): 95–116. DOI : 10.1007 / BF02289146 . hdl : 10.1007 / BF02289146 . PMID 18152948 . 
  5. ^ Стэнли Вассерман , Кэтрин Фауст, 1994. Анализ социальных сетей: методы и приложения. Кембридж: Издательство Кембриджского университета.
  6. ^ Tore Opsahl & Pietro Panzarasa (2009). «Кластеризация в взвешенных сетях» . Социальные сети . 31 (2): 155–163. DOI : 10.1016 / j.socnet.2009.02.002 .
  7. ^ a b Торе Опсал (2009). «Кластеризация в двухрежимных сетях» . Конференция и семинар по двухрежимному социальному анализу (30 сентября - 2 октября 2009 г.) .
  8. ^ Кемпер, Андреас (2009). Оценка сетевых эффектов на рынках программного обеспечения: комплексный сетевой подход . Springer. п. 142. ISBN. 9783790823660.
  9. ^ http://networksciencebook.com/4#ultra-small
  10. ^ Barrat, A .; Barthelemy, M .; Pastor-Satorras, R .; Веспиньяни, А. (2004). «Архитектура сложных весовых сетей» . Труды Национальной академии наук . 101 (11): 3747–3752. arXiv : cond-mat / 0311416 . Bibcode : 2004PNAS..101.3747B . DOI : 10.1073 / pnas.0400087101 . PMC 374315 . PMID 15007165 .  
  11. ^ Latapy, M .; Magnien, C .; Дель Веккьо, Н. (2008). «Основные понятия для анализа больших двухрежимных сетей». Социальные сети . 30 (1): 31–48. DOI : 10.1016 / j.socnet.2007.04.006 .
  12. ^ Fagiolo, G. (2007). «Кластеризация в сложных направленных сетях». Physical Review E . 76 (2 Pt 2): 026107. CiteSeerX 10.1.1.262.1006 . DOI : 10.1103 / PhysRevE.76.026107 . PMID 17930104 .  
  13. ^ Клементе, GP; Грасси, Р. (2018). «Направленная кластеризация в взвешенных сетях: новая перспектива». Хаос, солитоны и фракталы . 107 : 26–38. arXiv : 1706.07322 . Bibcode : 2018CSF ... 107 ... 26С . DOI : 10.1016 / j.chaos.2017.12.007 .
  14. ^ Кайзер, Маркус (2008). «Средние коэффициенты кластеризации: роль изолированных узлов и листьев в мерах кластеризации для сетей малого мира». Новый журнал физики . 10 (8): 083042. arXiv : 0802.2512 . Bibcode : 2008NJPh ... 10h3042K . DOI : 10.1088 / 1367-2630 / 10/8/083042 .
  15. ^ a b Barmpoutis, D .; Мюррей, RM (2010). «Сети с наименьшим средним расстоянием и наибольшей средней кластеризацией». arXiv : 1007.4031 [ q-bio.MN ].
  16. ^ MEJ Newman (2009). «Случайные графы с кластеризацией». Phys. Rev. Lett . 103 : 058701.
  17. ^ А. Хакетт; С. Мельник и Дж. П. Глисон (2011). «Каскады по классу сгруппированных случайных сетей». Phys. Rev. E . 83 : 056107.
  18. ^ С. Шао; X. Хуанг; Его Превосходительство Стэнли; С. Хавлин (2014). «Устойчивость частично взаимозависимой сети, сформированной из кластерных сетей». Phys. Rev. E . 89 : 032812.
  19. ^ , Фань Ван; Жуйджин Ду; Лисинь Тиан; Шуай Шао; H Юджин Стэнли; Шломо Хавлин (2019). «Локализованная атака на сети с кластеризацией Хуэйфан Хао». Новый журнал физики . 21 : 013014.
  20. ^ Л. Янке; JW Kantelhardt; Р. Берковиц; S. Havlin Phys (2008). «Локализация волн в сложных сетях с высокой кластеризацией». Phys. Rev. Lett . 101 : 175702.

Внешние ссылки [ править ]

  • СМИ, связанные с коэффициентом кластеризации на Викискладе?