Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Сеть зависимостей подход обеспечивает анализ системного уровня активности и топологию направленных сетей . Подход извлекает причинно-следственные связи между узлами сети (при анализе сетевой структуры) и обеспечивает важный шаг к выводу причинно-следственных связей между узлами сети (при анализе сетевой активности). Эта методика первоначально была введена для изучения финансовых данных, [1] [2] она была расширена и применена к другим системам, таким как иммунная система , [3] и семантические сети . [4]

В случае сетевой активности, анализ основан на частичных корреляций , [5] [6] [7] [8] [9] , которые становятся все более широко используется для исследования сложных систем . Проще говоря, частичная (или остаточная) корреляция - это мера влияния (или вклада) данного узла, скажем, j , на корреляции между другой парой узлов, скажем, i и k . Используя эту концепцию, зависимость одного узла от другого вычисляется для всей сети. Это приводит к ориентированной взвешенной матрице смежностиполностью подключенной сети. После построения матрицы смежности для построения сети можно использовать различные алгоритмы, такие как пороговая сеть, минимальное связующее дерево (MST) , планарный график с максимальной фильтрацией (PMFG) и другие.

Сеть зависимостей финансовых данных для 300 акций S & P500, торгуемых в период 2001–2003 годов. Акции сгруппированы по секторам экономики, а стрелка указывает направление влияния. Центром сети, наиболее влиятельным сектором, является финансовый сектор. Воспроизведение из Kenett et al., PLoS ONE 5 (12), e15032 (2010)

Важность [ править ]

Сеть зависимостей на основе частичной корреляции - это класс корреляционной сети, способной обнаруживать скрытые связи между своими узлами.

Эта оригинальная методология была впервые представлена ​​в конце 2010 года и опубликована в PLoS ONE . [1] Они количественно раскрыли скрытую информацию о базовой структуре фондового рынка США , информацию, которой не было в стандартных сетях корреляции . Одним из основных результатов этой работы является то, что за исследуемый период времени (2001–2003 гг.) В структуре сети преобладали компании, принадлежащие к финансовому сектору , которые являются хабами в сети зависимостей. Таким образом, они впервые смогли количественно показать отношения зависимости между различными секторами экономики.. После этой работы, методология сети зависимости была применена к изучению системы иммунитета , [3] и семантические сети . [4] Таким образом, эта методология применима к любой сложной системе .

Сеть зависимости активности специфических антител, измеренная для группы матерей. Панель (а) представляет сеть зависимостей, а панель (б) - стандартную корреляционную сеть. Воспроизведение из Madi et al., Chaos 21, 016109 (2011).
Пример сети зависимостей ассоциаций, построенной из полной семантической сети. Воспроизведение из Kenett et al., PLoS ONE 6 (8): e23912 (2011)

Обзор [ править ]

Чтобы быть более конкретным, частные корреляции пары при заданном j - это корреляции между ними после надлежащего вычитания корреляций между i и j и между k и j . Определенная таким образом разница между корреляциями и частичными корреляциями обеспечивает меру влияния узла j на корреляцию . Следовательно, мы определяем влияние узла j на узел i или зависимость узла i от узла j  -  D ( i , j ) как сумму влияния узлаj о корреляциях узла i со всеми остальными узлами.

В случае сетевой топологии анализ основан на влиянии удаления узла на кратчайшие пути между узлами сети. Более конкретно, мы определяем влияние узла j на каждую пару узлов (i, k) как обратное топологическому расстоянию между этими узлами при наличии j минус обратное расстояние между ними при отсутствии узла j . Затем мы определяем влияние узла j на узел i или зависимость узла i от узла j  -  D ( i , j ) как сумму влияния узла jна расстояниях между узлом i со всеми остальными узлами  k .

Сети зависимости активности [ править ]

Корреляции узел-узел [ править ]

Корреляции узел-узел можно рассчитать по формуле Пирсона :

Где и - активность узлов i и j субъекта n, μ обозначает среднее значение, а sigma - стандартное отклонение динамических профилей узлов i и j . Обратите внимание, что корреляции узел-узел (или для простоты корреляции узлов) для всех пар узлов определяют симметричную корреляционную матрицу, элементом которой является корреляция между узлами i и j .

Частичные корреляции [ править ]

Затем мы используем полученные корреляции узлов для вычисления частичных корреляций. Частичный коэффициент корреляции первого порядка - это статистическая мера, показывающая, как третья переменная влияет на корреляцию между двумя другими переменными. Частичная корреляция между узлами i и k по отношению к третьему узлу определяется как:

где и - корреляции узлов, определенные выше.

Корреляционное влияние и корреляционная зависимость [ править ]

Относительное влияние корреляций и узла j на корреляцию C ( i , k ) определяется как:

Это позволяет избежать тривиального случая был узел J , кажется, сильно влияет на соотношение , в основном потому , что и имеет малые значения. Отметим, что эту величину можно рассматривать либо как корреляционную зависимость C ( i , k ) от узла j (термин, используемый здесь), либо как корреляционное влияние узла j на корреляцию C ( i , k ).

Зависимости активности узла [ править ]

Затем мы определяем общее влияние узла j на узел i или зависимость D ( i , j ) узла i от узла j следующим образом:

Как определено, D ( i , j ) является мерой среднего влияния узла j на корреляции C (i, k) по всем узлам k, не равным j . Зависимости активности узла определяют матрицу зависимостей D , элемент ( i , j ) которой является зависимостью узла i от узла j . Важно отметить, что хотя корреляционная матрица C является симметричной матрицей, матрица зависимостей D несимметрична, поскольку влияние узла j на узел iне равно влиянию узла i на узел j . По этой причине некоторые методы, используемые при анализе корреляционной матрицы (например, PCA), должны быть заменены или менее эффективны. Тем не менее, есть и другие методы, такие как те, что используются здесь, которые могут правильно объяснить несимметричный характер матрицы зависимостей.

Сети зависимости структуры [ править ]

Влияние пути и зависимость расстояния: Относительное влияние узла j на направленный путь - кратчайший топологический путь с каждым сегментом соответствует расстоянию 1 между узлами i и k :

где и - кратчайший направленный топологический путь от узла i к узлу k при наличии и отсутствии узла j соответственно.

Структурные зависимости узлов [ править ]

Затем мы определяем общее влияние узла j на узел i или зависимость D ( i , j ) узла i от узла j следующим образом:

Как определено, D ( i , j ) является мерой среднего влияния узла j на направленные пути от узла i ко всем другим узлам k . Структурные зависимости узла определяют матрицу зависимостей D , элемент ( i , j ) которой является зависимостью узла i от узла j или влиянием узла j на узел i . Важно отметить, что матрица зависимостей D несимметрична - поскольку влияние узла j на узел i не равно влиянию узлаi на узле j .

Визуализация сети зависимостей [ править ]

Матрица зависимостей - это взвешенная матрица смежности, представляющая полностью подключенную сеть. Различные алгоритмы могут применяться для фильтрации полностью подключенной сети для получения наиболее значимой информации, например, с использованием порогового подхода [1] или различных алгоритмов отсечения. Широко используемый метод построения информативного подграфа полной сети - это минимальное связующее дерево (MST). [10] [11] [12] [13] [14] Другой информативный подграф, который сохраняет больше информации (по сравнению с MST), - это планарный график с максимальной фильтрацией (PMFG) [15], который используется здесь. Оба метода основаны на иерархической кластеризации, и результирующие подграфы включают все Nузлы в сети, чьи края представляют собой наиболее релевантные взаимосвязи ассоциаций. Подграф MST содержит ребра без петель, а подграф PMFG содержит ребра.

Ссылки [ править ]

  1. ^ a b c Kenett, Dror Y .; Тумминелло, Микеле; Мади, Асаф; Гур-Гершгорен, Гитит; Mantegna, Rosario N .; Бен-Джейкоб, Эшель (20 декабря 2010 г.). Скалас, Энрико (ред.). «Доминирующая часть финансового сектора, выявленная частичным корреляционным анализом фондового рынка» . PLOS ONE . 5 (12): e15032. Bibcode : 2010PLoSO ... 515032K . DOI : 10.1371 / journal.pone.0015032 . ISSN  1932-6203 . PMC  3004792 . PMID  21188140 .
  2. ^ Дрор Ю. Кенетт, Йоаш Шапира, Гитит Гур-Гершгорен и Эшель Бен-Джейкоб (представлены), Анализ силы сплоченности индекса фондового рынка США, Труды Международной конференции по эконофизике 2011 г., Кавала, Греция
  3. ^ a b Асаф Мади, Дрор Ю. Кенетт, Шаррон Брансбург-Забари, Ифат Мербл, Франсиско Дж. Кинтана, Стефано Боккалетти, Альфред И. Таубер, Ирун Р. Коэн и Эшель Бен-Джейкоб (2011), Анализ зависимости от антигена сети раскрывают реорганизацию иммунной системы между рождением и взрослой жизнью, Хаос 21, 016109
  4. ^ a b Kenett, Yoed N .; Kenett, Dror Y .; Бен-Джейкоб, Эшель; Фауст, Мириам (24 августа 2011 г.). Perc, Matjaz (ред.). «Глобальные и локальные особенности семантических сетей: данные из ментального лексикона иврита» . PLOS ONE . 6 (8): e23912. Bibcode : 2011PLoSO ... 623912K . DOI : 10.1371 / journal.pone.0023912 . ISSN 1932-6203 . PMC 3161081 . PMID 21887343 .   
  5. ^ Кунихиро Баба, Ритель Шибата, Масааки Сибуя (2004), Частичная корреляция и условная корреляция как меры условной независимости, Aust New Zealand J Stat 46 (4): 657–774
  6. ^ Yoash Шапира, Дрор Ю. Kenett и Eshel Ben-Jacob (2009), Индекс Сплоченная Влияние на фондовом рынке Корреляция, Журнал Физика Б. т. 72, нет. 4. С. 657–669.
  7. ^ Kenett, Dror Y .; Шапира, Йоаш; Мади, Асаф; Брансбург-Забары, Шаррон; Гур-Гершгорен, Гитит; Бен-Джейкоб, Эшель (27 апреля 2011 г.). Скалас, Энрико (ред.). «Анализ силы сцепления индексов показывает, что рынок США стал склонен к системным коллапсам с 2002 года» . PLOS ONE . 6 (4): e19378. Bibcode : 2011PLoSO ... 619378K . DOI : 10.1371 / journal.pone.0019378 . ISSN 1932-6203 . PMC 3083438 . PMID 21556323 .   
  8. ^ Дрор Ю. Кенетт, Матиас Раддант, Томас Люкс и Эшель Бен-Джейкоб (представлены), Развитие единообразия и волатильности на напряженном глобальном рынке, PNAS
  9. ^ Эран Старк, Ротем Дрори и Моше Абелес (2006), Частичный кросс-корреляционный анализ разрешает неоднозначность в кодировании множественных характеристик движения, J Neurophysiol 95: 1966–1975
  10. ^ Росарио Н. Мантенья, Иерархическая структура на финансовых рынках, Eur. Phys. J. B 11 (1), 193–197 (1999)
  11. Розарио Н. Мантенья, Computer Physics Communications 121–122, 153–156 (1999)
  12. ^ Гильермо Дж. Ортега, Рафаэль Г. Сола и Хесус Пастор, Комплексный сетевой анализ данных ЭКоГ человека, Neuroscience Letters 447 (2-3), 129–133 (2008) [ постоянная мертвая ссылка ]
  13. ^ Микеле Тумминелло, Клаудиа Короннелло, Фабрицио Лилло, Сальваторе Миччише и Рросарио Н. Мантенья, Связующие деревья и оценки надежности начальной загрузки в сетях на основе корреляции [1]
  14. ^ Дуглас Б. Уэст, Введение в теорию графов, под редакцией Прентис-Холла, Энглвуд Клиффс, Нью-Джерси, 2001
  15. ^ Микеле Тумминелло, Томазо Асте, Тициана Ди Маттео и Розарио Н. Мантенья, Инструмент для фильтрации информации в сложных системах, PNAS 102 (30), 10421–10426 (2005)

См. Также [ править ]

  • Семантическая лексика
  • Сеть зависимостей (графическая модель)

Внешние ссылки [ править ]

  • Обсерватория сложных систем
  • Форум по эконофизике
  • FuturICT Израиль