Сходство (сетевая наука)

Сходство в сетевом анализе происходит, когда два узла (или другие более сложные структуры) попадают в один и тот же класс эквивалентности.

Существует три основных подхода к построению мер сетевого сходства: структурная эквивалентность, автоморфная эквивалентность и регулярная эквивалентность. ^[1] Существует иерархия трех концепций эквивалентности: любой набор структурных эквивалентностей также является автоморфными и регулярными эквивалентностями. Любой набор автоморфных эквивалентностей также является регулярными эквивалентностями. Не все регулярные эквивалентности обязательно автоморфны или структурны; и не все автоморфные эквивалентности обязательно являются структурными. ^[2]

Визуализация сходства и расстояния

Инструменты кластеризации

Агломеративная иерархическая кластеризация узлов на основе сходства их профилей связей с другими узлами обеспечивает дерево соединений или дендрограмму, которая визуализирует степень сходства между случаями - и может использоваться для поиска приблизительных классов эквивалентности. ^[2]

Инструменты многомерного масштабирования

Обычно наша цель в анализе эквивалентности - идентифицировать и визуализировать «классы» или кластеры случаев. При использовании кластерного анализа мы неявно предполагаем, что сходство или расстояние между случаями отражаются как единственное лежащее в основе измерение. Однако возможно, что существует множество «аспектов» или «измерений», лежащих в основе наблюдаемого сходства случаев. Факторный или компонентный анализ может применяться к корреляциям или ковариациям между случаями. В качестве альтернативы можно использовать многомерное масштабирование (неметрическое для данных, которые по своей сути являются номинальными или порядковыми; метрические для оцененных). ^[2]

MDS представляет образцы сходства или несходства в профилях связей между участниками (применительно к смежности или расстояниям) в виде «карты» в многомерном пространстве. Эта карта позволяет нам увидеть, насколько «близки» акторы, «сгруппированы» ли они в многомерном пространстве и насколько вариативны по каждому измерению. ^[2]

Структурная эквивалентность

Две вершины сети структурно эквивалентны, если у них много одинаковых соседей.

Структурная эквивалентность

Не существует актера, который имеет точно такой же набор связей, что и актер A, поэтому актер A находится в классе сам по себе. То же самое верно для субъектов B, C, D и G. Каждый из этих узлов имеет уникальный набор ребер для других узлов. E и F, однако, относятся к одному классу структурной эквивалентности. У каждого есть только одно ребро; и эта связь связана с B. Поскольку E и F имеют точно такой же образец ребер со всеми вершинами, они структурно эквивалентны. То же верно и в случае H и I. ^[2]

Структурная эквивалентность - самая сильная форма сходства. Во многих реальных сетях точная эквивалентность может быть редкостью, и было бы полезно облегчить критерии и измерить приблизительную эквивалентность.

Тесно связанной концепцией является институциональная эквивалентность : два участника (например, фирмы) институционально эквивалентны, если они действуют в одном и том же наборе институциональных полей. ^[3] В то время как структурно эквивалентные акторы имеют идентичные паттерны отношений или сетевые позиции, институциональная эквивалентность отражает сходство институциональных влияний, которые акторы испытывают, находясь в одних и тех же областях, независимо от того, насколько схожи их сетевые позиции. Например, два банка в Чикаго могут иметь очень разные схемы связей (например, один может быть центральным узлом, а другой - периферийным), так что они не являются структурными эквивалентами, а потому, что оба работают на местах. в сфере финансов и банковского дела и в одной и той же географически определенной области (Чикаго) они будут подвержены одним и тем же институциональным влияниям. ^[3]

Меры структурной эквивалентности

Косинусное сходство

Простой подсчет общих соседей для двух вершин сам по себе не очень хороший показатель. Необходимо знать степень вершин или количество общих соседей у других пар вершин. Косинусное сходство учитывает эти аспекты, а также допускает различную степень вершин. Салтон предложил рассматривать i-ю и j-ю строки / столбцы матрицы смежности как два вектора и использовать косинус угла между ними в качестве меры сходства . Косинусное сходство i и j - это количество общих соседей, деленное на среднее геометрическое их степеней. ^[4]

Его значение находится в диапазоне от 0 до 1. Значение 1 указывает, что две вершины имеют точно такие же соседи, а значение нуля означает, что у них нет общих соседей. Косинусное сходство технически не определено, если один или оба узла имеют нулевую степень, но в соответствии с соглашением мы говорим, что косинусное сходство в этих случаях равно 0. ^[1]

Коэффициент Пирсона

Коэффициент корреляции произведение-момент Пирсона является альтернативным методом нормализации количества общих соседей. Этот метод сравнивает количество общих соседей с ожидаемым значением, которое будет принимать count в сети, где вершины соединены случайным образом. Эта величина лежит строго в диапазоне от -1 до 1. ^[1]

Евклидово расстояние

Евклидово расстояние равно количеству соседей, различающихся между двумя вершинами. Это скорее мера несходства, поскольку она больше для вершин, которые больше различаются. Его можно нормализовать путем деления на максимальное значение. Максимум означает, что общих соседей нет, и в этом случае расстояние равно сумме степеней вершин. ^[1]

Автоморфная эквивалентность

Формально «Две вершины автоморфно эквивалентны, если все вершины могут быть перемаркированы, чтобы сформировать изоморфный граф с поменкой местами меток u и v. Две автоморфно эквивалентные вершины обладают точно такими же независимыми от меток свойствами». ^[5]

Более интуитивно, акторы автоморфно эквивалентны, если мы можем переставить граф таким образом, чтобы обмен двумя акторами не влиял на расстояния между всеми акторами в графе.

Автоморфная эквивалентность

Предположим, график описывает организационную структуру компании. Актер A - центральный штаб, актеры B, C и D - менеджеры. Актеры E, F и H, I работают в небольших магазинах; G - одинокий работник в другом магазине.

Несмотря на то, что субъект B и субъект D структурно не эквивалентны (у них один и тот же начальник, но не одни и те же рабочие), они кажутся «эквивалентными» в другом смысле. У обоих менеджеров B и D есть босс (в данном случае один и тот же босс), и у каждого по два рабочих. Если бы мы поменяли их местами, а также поменяли местами четырех рабочих, все расстояния между всеми участниками сети были бы точно такими же.

Фактически существует пять классов автоморфной эквивалентности: {A}, {B, D}, {C}, {E, F, H, I} и {G}. Обратите внимание, что менее строгое определение «эквивалентности» уменьшило количество классов. ^[2]

Обычная эквивалентность

Формально «два актера обычно эквивалентны, если они в равной степени связаны с другими эквивалентными». Другими словами, правильно эквивалентные вершины - это вершины, которые, хотя и не обязательно имеют общих соседей, имеют соседей, которые сами похожи. ^[5]

Две матери, например, эквивалентны, потому что каждая из них имеет сходный образец связей с мужем, детьми и т. Д. Две матери не связаны с одним и тем же мужем или одними и теми же детьми, поэтому они структурно не эквивалентны. Поскольку у разных матерей может быть разное количество мужей и детей, они не будут автоморфно эквивалентными. Но они похожи, потому что у них такие же отношения с некоторыми членами или членами другой группы акторов (которые сами считаются эквивалентными из-за сходства их связей с членом множества «мать»). ^[2]

Обычная эквивалентность

В графе есть три регулярных класса эквивалентности. Первый - актер А; второй составлен из трех актеров B, C и D; третий состоит из оставшихся пяти актеров E, F, G, H и I.

Легче всего увидеть пять актеров в нижней части диаграммы (E, F, G, H и I). Эти действующие лица обычно эквивалентны друг другу, потому что:

они не связаны ни с одним актером из первого класса (то есть с актером A) и
у каждого есть связь с актером из второго класса (B, C или D).

Таким образом, каждый из пяти актеров имеет идентичный образец связей с актерами других классов.

Актеры B, C и D образуют класс аналогичным образом. B и D фактически связаны с двумя членами третьего класса, тогда как субъект C связан только с одним членом третьего класса, но это не имеет значения, поскольку существует связь с некоторым членом третьего класса.

Актер A сам по себе принадлежит к классу, определяемому:

ничья по крайней мере с одним представителем второго класса и
нет связи ни с одним членом третьего класса. ^[2]

Смотрите также

Мера сходства

Сходство (сетевая наука)

Визуализация сходства и расстояния

Инструменты кластеризации

Инструменты многомерного масштабирования

Структурная эквивалентность

Меры структурной эквивалентности

Косинусное сходство

Коэффициент Пирсона

Евклидово расстояние

Автоморфная эквивалентность

Обычная эквивалентность

Смотрите также

Рекомендации