Сеть реляционной зависимости


Реляционные сети зависимостей (RDN) — это графические модели, которые расширяют сети зависимостей для учета реляционных данных. Реляционные данные — это данные, организованные в одну или несколько таблиц, которые связаны между собой стандартными полями. Реляционная база данных — это канонический пример системы, которая служит для хранения реляционных данных. Сеть реляционной зависимости может использоваться для характеристики знаний, содержащихся в базе данных.

Реляционные сети зависимостей (или RDN) стремятся получить совместное распределение вероятностей по переменным набора данных, представленного в реляционной области. Они основаны на сетях зависимостей (или DN) и расширяют их до реляционных настроек. RDN имеют эффективные методы обучения, где RDN может изучать параметры независимо, условные распределения вероятностей могут оцениваться отдельно. Поскольку могут быть некоторые несоответствия из-за метода независимого обучения, RDN используют выборку Гиббса для восстановления совместного распределения, как и DN.

Другими словами, граф данных указывает, как граф модели будет развернут для создания графа логического вывода.

Методы обучения RDN аналогичны методам, используемым DN. т. е. все условные распределения вероятностей могут быть изучены для каждой из переменных независимо. Однако в процессе оценки параметров для RDN можно использовать только условные реляционные обучающиеся. Следовательно, учащиеся, используемые DN, такие как деревья решений или логистическая регрессия , не работают для RDN.

Невилл, Дж. и Дженсен, Д. (2007) [1] провели несколько экспериментов, сравнивая RDN при обучении с помощью реляционных байесовских классификаторов и RDN при обучении с реляционными деревьями вероятностей. Натараджан и др. (2012) [2] использовали серию регрессионных моделей для представления условных распределений.

Этот метод обучения делает RDN моделью с эффективным временем обучения. Однако этот метод также делает RDN восприимчивыми к некоторым структурным или числовым несоответствиям. Если в методе условного распределения вероятностей используется выбор признаков, то возможно, что данная переменная находит зависимость между собой и другой переменной, в то время как последняя эту зависимость не находит. В этом случае RDN является структурно несогласованным. Кроме того, если сумма совместного распределения не равна единице из-за аппроксимаций, вызванных независимым обучением, то это называется числовой несогласованностью. Однако такие несоответствия можно обойти на этапе вывода.