Виноградная копула


Виноградная лоза — это графический инструмент для маркировки ограничений в многомерных распределениях вероятностей . Обычная лоза — это частный случай, для которого все ограничения двумерны или условно двумерны. Обычные лозы обобщают деревья и сами являются специализациями дерева Кантора . [1]

В сочетании с двумерными копулами регулярные лозы оказались гибким инструментом в моделировании многомерных зависимостей. Копулы[2] [3]представляют собой многомерные распределения с равномерными одномерными полями. Представление совместного распределения в виде одномерных полей плюс копулы позволяет отделить проблемы оценки одномерных распределений от проблем оценки зависимости. Это удобно, поскольку одномерные распределения во многих случаях могут быть адекватно оценены по данным, в то время как информация о зависимостях известна приблизительно, включая сводные показатели и суждения. [4] [5]Хотя количество семейств параметрических многомерных связок с гибкой зависимостью ограничено, существует множество параметрических семейств двумерных связок. Обычные лозы обязаны своей растущей популярностью тому факту, что они используют двумерные связки и позволяют расширяться до произвольных размеров. Теория выборки и теория оценивания для регулярных лоз хорошо разработаны[6] [7]и модельный вывод оставил пост. [8] [9] [7] Регулярные лозы оказались полезными в других задачах, таких как (ограниченная) выборка корреляционных матриц, [10] [11] построение непараметрических непрерывных байесовских сетей . [12] [13]

Например, в финансах было показано, что связки лозы эффективно моделируют хвостовой риск в приложениях по оптимизации портфеля. [14]

Первая регулярная лоза, avant la lettre, была представлена ​​Гарри Джо. [15]Цель состояла в том, чтобы расширить параметрические двумерные семейства копул с экстремальными значениями на более высокие размерности. С этой целью он представил то, что позже назовут D-vine . Джо[16]интересовал класс n-вариантных распределений с заданными одномерными запасами и n ( n - 1) параметрами зависимости, при этом n - 1 параметр соответствует двумерным запасам, а остальные соответствуют условным двумерным запасам. В случае многомерных нормальных распределений параметрами будут n - 1 корреляция и ( n - 1)( n - 2)/2частичные корреляции , которые, как было отмечено, алгебраически независимы в (−1, 1).

Совершенно иная мотивация лежала в основе первого формального определения виноградной лозы у Кука. [17]Анализ неопределенностей моделей больших рисков, таких как те, которые были предприняты для Европейского Союза и Комиссии по ядерному регулированию США для аварий на атомных электростанциях, включают количественную оценку и распространение неопределенности по сотням переменных.[18] [19] [20]Информация о зависимостях для таких исследований была получена с помощью деревьев Маркова ,[21]которые представляют собой деревья, построенные с узлами как одномерными случайными величинами и ребрами как двумерными связками. Для n переменных существует не более n− 1 ребро, для которого можно указать зависимость. Новые методы того времени включали получение распределений неопределенностей по параметрам моделирования путем выявления неопределенностей экспертов по другим переменным, которые предсказываются моделями. Эти распределения неопределенности возвращаются к параметрам модели с помощью процесса, известного как вероятностная инверсия.[8] [18]Полученные распределения часто отображали структуру зависимости, которую нельзя было представить в виде дерева Маркова.

Графические модели , называемые вайнами, были представлены в[1] [8] [17]. Важной особенностью вайнов является то, что они могут добавлять условные зависимости между переменными поверх дерева Маркова, которое, как правило, слишком экономно для суммирования зависимости между переменными.


C-лоза на 4 переменных
D-лоза на 4 переменных
R-лоза на 5 переменных