Мера включения


Меры включения — несимметричные меры сходства отражающие степень близости одного объекта относительно другого. Использовать меры включения по отдельности не имеет смысла. Меры включения также известны как асимметричные меры, направленные меры конвергенции. Меры включения отражают отношения «целого-части». Также существует понятие мер невключения, которые определяются как дополнение мер включения до 1. Обычно меры включения представляют в виде матрицы включения

Следует особо отметить, что меры включения более информативны в общем и особенно для разновеликих по числу признаков объектов, чем меры сходства, так как последние, по сути, представляют собой усреднённые показатели и, следовательно, теряют часть информации об объектах, а несимметричные меры включения адекватно оценивают более распространённые в природе нетранзитивные отношения. Например, один список может включаться на 100 % в другой список, а другой список в свою очередь включаться только на 10 %. При этом коэффициент сходства не сможет адекватно отразить эти отношения, так как, например, 10 общих видов значительны для одного списка в 10 видов, но не столь значимы для большого списка в (к примеру) 100 видов. Мера сходства Сёренсена в данном случае будет равна около 20 %.[1][2]
В общем виде несимметричные меры сходства можно представить так: ; . А конкретную меру включения можно рассчитать из общей формулы континуума мер сходства Сёмкина.

Подобные меры, под названием коэффициентов «полноты» и «точности» нашли широкое применение в информационно-поисковых системах[3][4]. Под названием «коэффициентов неспецифичности» одной флоры относительно другой использовались во флористике Б. А. Юрцевым[5][6]. После работ Б. И. Семкина и Т. А. Комаровой[7][8] меры включения стали широко использоваться в синэкологии и биогеографии[9].
Наиболее часто используются меры: