Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Дерево покрытия представляет собой тип структуры данных в компьютерной науке , которая специально разработан для облегчения быстрого плана ближайшего поиска соседа . Это усовершенствованная структура данных Navigating Net, связанная с множеством других структур данных, разработанных для индексации низкоразмерных данных. [1]

Дерево можно рассматривать как иерархию уровней, где верхний уровень содержит корневую точку, а нижний уровень - каждую точку в метрическом пространстве. Каждый уровень C связан с целочисленным значением i, которое уменьшается на единицу по мере спуска дерева. Каждый уровень C в дереве обложек имеет три важных свойства:

  • Вложенность:
  • Покрытие: для каждой точки существует точка , расстояние от которой до меньше или равно, и ровно одна такая точка является родительской для .
  • Разделение: для всех точек расстояние от до больше чем .

Сложность [ править ]

Найдите [ редактировать ]

Как и другие деревья показателей, дерево покрытия позволяет выполнять поиск ближайшего соседа, где - константа, связанная с размерностью набора данных, а n - мощность. Для сравнения требуется простой линейный поиск , который гораздо хуже зависит от . Однако в большой размерности метрических пространств константа нетривиальная, что означает , что нельзя игнорировать при анализе сложности. В отличие от других деревьев показателей, дерево покрытия имеет теоретическую границу своей константы, которая основана на константе расширения набора данных или константе удвоения (в случае приблизительного извлечения NN). Связанный на время поиска , где есть постоянное расширение набора данных.

Вставить [ изменить ]

Хотя деревья покрытия обеспечивают более быстрый поиск, чем наивный подход, это преимущество необходимо сопоставить с дополнительными затратами на поддержку структуры данных. При наивном подходе добавление новой точки в набор данных тривиально, потому что порядок не нужно сохранять, но в дереве обложки это может занять время. Однако это верхний предел, и были реализованы некоторые методы, которые, кажется, улучшают производительность на практике. [2]

Пробел [ править ]

Дерево обложки использует неявное представление для отслеживания повторяющихся точек. Таким образом, для этого требуется только O (n) пространства.

См. Также [ править ]

Ссылки [ править ]

Примечания
  1. ^ Кеннет Кларксон. Поиск ближайшего соседа и измерения метрического пространства. В G. Shakhnarovich, T. Darrell и P. Indyk , редакторах, Ближайшие методы обучения и видения: теория и практика, стр. 15-59. MIT Press, 2006.
  2. ^ http://hunch.net/~jl/projects/cover_tree/cover_tree.html
Библиография