Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В математике , А евклидово расстояние матрица представляет собой п × п матрица , представляющая интервал набора п точек в евклидовом пространстве . Для точек в k -мерном пространстве k элементы их евклидовой матрицы расстояний A задаются квадратами расстояний между ними. Это

где обозначает евклидову норму на k .

В контексте (не обязательно евклидовых) матриц расстояний элементы обычно определяются непосредственно как расстояния, а не их квадраты. Однако в евклидовом случае квадраты расстояний используются, чтобы избежать вычисления квадратных корней и упростить соответствующие теоремы и алгоритмы.

Матрицы евклидовых расстояний тесно связаны с матрицами Грама (матрицы скалярных произведений , описывающие нормы векторов и углы между ними). Последние легко анализируются методами линейной алгебры . Это позволяет охарактеризовать матрицы евклидовых расстояний и восстановить точки, которые это реализуют. Реализация, если она существует, уникальна с точностью до жестких преобразований , то есть сохраняющих расстояние преобразований евклидова пространства ( вращения , отражения , трансляции ).

В практических приложениях расстояния являются зашумленными измерениями или основаны на произвольных оценках несходства (не обязательно метрических ). Целью может быть визуализация таких данных с помощью точек в евклидовом пространстве, матрица расстояний которых максимально приближает заданную матрицу несходства - это известно как многомерное масштабирование . В качестве альтернативы, учитывая два набора данных, уже представленных точками в евклидовом пространстве, можно спросить, насколько они похожи по форме, то есть насколько тесно они могут быть связаны преобразованием, сохраняющим расстояние - это анализ Прокруста.. Некоторые из расстояний также могут отсутствовать или быть немаркированными (как неупорядоченный набор или мультимножество вместо матрицы), что приводит к более сложным алгоритмическим задачам, таким как проблема реализации графа или проблема магистрали (для точек на линии). [1] [2]

Свойства [ править ]

Поскольку евклидово расстояние является метрикой , матрица A обладает следующими свойствами.

В размерности k матрица евклидовых расстояний имеет ранг, меньший или равный k +2 . Если точки находятся в общем положении , ранг в точности равен min ( n , k + 2).

Расстояния можно уменьшить любой степенью, чтобы получить другую матрицу евклидовых расстояний. То есть, если является матрицей евклидовых расстояний, то является матрицей евклидовых расстояний для каждого 0 < s <1 . [3]

Связь с матрицей Грама [ править ]

Матрица Грама последовательности точек в K - мерном пространстве к является п × п матрица их продукции точечными (здесь точка мыслится как вектор от 0 до этой точки):

, где - угол между вектором и .

В частности

это квадрат расстояния от 0 .

Таким образом, матрица Грама описывает нормы и углы векторов (от 0 до) .

Позвольте быть k × n матрица, содержащая как столбцы. потом

, потому что ( как вектор-столбец).

Матрицы, которые могут быть разложены как , то есть, матрицы Грама некоторой последовательности векторов (столбцов ), хорошо известны - это в точности положительные полуопределенные матрицы .


Чтобы связать матрицу евклидовых расстояний с матрицей Грама, заметьте, что

То есть нормы и углы определяют расстояния. Обратите внимание, что матрица Грама содержит дополнительную информацию: расстояния от 0 .

И наоборот, расстояния между парами из n +1 точек определяют скалярные произведения между n векторами ( 1≤ in ):

(это известно как поляризационная идентичность ).

Характеристики [ править ]

Для п × п матрицы А , последовательность точек в K - мерном евклидовом пространстве к называется реализация из А в к , если является их евклидово расстояние матрица. Можно считать без ограничения общности , что (так как перевод на варенье расстояния).

Теорема [4]  ( критерий Шенберг , [5] независимо друг от друга показали Young & Хаусхолдер [6] )  -  Симметричный полым п × п матрица с вещественными элементами допускает реализацию в к тогда и только тогда , когда ( п - 1) × ( n -1) матрица, определяемая

является неотрицательно и имеет ранг в большинстве к .

Это следует из предыдущего обсуждения, потому что G положительно полуопределенный ранг не выше k тогда и только тогда, когда он может быть разложен как где X - матрица k × n . [7] Кроме того, столбцы X задают реализацию в k . Следовательно, любой метод разложения G позволяет найти реализацию. Два основных подхода - это варианты разложения Холецкого или использование спектральных разложений для нахождения главного квадратного корня из G , см. Определенная матрица # Разложение .

Утверждение теоремы выделяет первый пункт . Более симметричный вариант той же теоремы следующий:

Следствие [8]  -  симметричный полая п × п матрица с вещественными элементами допускает реализацию , если и только если полуотрицательно на гиперплоскости , то есть

за все такое что .

Другие характеристики включают детерминанты Кэли-Менгера . В частности, они позволяют показать, что симметричная полая матрица размера n × n реализуема в k тогда и только тогда, когда каждая главная подматрица ( k +3) × ( k +3) реализуется . Другими словами, полуметрика на конечном числе точек изометрически вложима в k тогда и только тогда, когда все k +3 точки вложены . [9]

На практике условия определенности или ранжирования могут не выполняться из-за численных ошибок, шума в измерениях или из-за того, что данные не поступают с фактических евклидовых расстояний. Точки, которые реализуют оптимально похожие расстояния, затем могут быть найдены с помощью полуопределенного приближения (и приближения низкого ранга, если необходимо) с использованием линейных алгебраических инструментов, таких как разложение по сингулярным значениям или полуопределенное программирование . Это называется многомерным масштабированием . Варианты этих методов также могут иметь дело с неполными данными о расстоянии.

Немаркированные данные, то есть набор или мультимножество расстояний, не назначенных конкретным парам, гораздо сложнее. Такие данные возникают, например, при секвенировании ДНК (в частности, при восстановлении генома из частичного переваривания ) или фазовом извлечении . Два набора точек называются гомометрическими, если они имеют одно и то же мультимножество расстояний (но не обязательно связаны жестким преобразованием). Решить, может ли данное мультимножество из n ( n -1) / 2 расстояний быть реализовано в данной размерности k, является строго NP-трудным.. В одном измерении это известно как проблема магистрали; остается открытым вопрос, можно ли решить эту проблему за полиномиальное время. Когда мультимножество расстояний дается с планками ошибок, даже одномерный случай NP-труден . Тем не менее, практические алгоритмы существуют для многих случаев, например для случайных точек. [10] [11] [12]

Уникальность представлений [ править ]

Учитывая евклидову матрицу расстояний, последовательность точек, реализующих ее, уникальна с точностью до жестких преобразований - это изометрии евклидова пространства: вращения , отражения , сдвиги и их композиции. [1]

Теорема  -  Пусть и - две последовательности точек в k -мерном евклидовом пространстве k . Расстояния и равны (для всех 1≤ i , jn ) тогда и только тогда, когда существует жесткое преобразование k, отображающего в (для всех 1≤ in ).


В приложениях, когда расстояния не совпадают точно, анализ Прокруста стремится связать два набора точек как можно ближе с помощью жестких преобразований, обычно с использованием разложения по сингулярным значениям . Обычный евклидов случай известен как ортогональная проблема Прокруста или проблема Вахбы (когда наблюдения взвешиваются для учета различных неопределенностей). Примеры приложений включают определение ориентации спутников, сравнение структуры молекул (в хеминформатике ), структуры белка ( структурное выравнивание в биоинформатике ) или структуры костей ( статистический анализ формы в биологии).

См. Также [ править ]

  • Матрица смежности
  • Копланарность
  • Геометрия расстояния
  • Матрица расстояний
  • Евклидова случайная матрица
  • Классическое многомерное масштабирование , метод визуализации, аппроксимирующий произвольную матрицу несходства евклидовой матрицей расстояний
  • Определитель Кэли-Менгера
  • Полуопределенное вложение

Заметки [ править ]

  1. ^ a b Dokmanic et al. (2015)
  2. ^ Итак (2007)
  3. ^ Maehara, Hiroshi (2013). «Евклидовы вложения конечных метрических пространств» . Дискретная математика . 313 (23): 2848–2856. DOI : 10.1016 / j.disc.2013.08.029 . ISSN  0012-365X . Теорема 2.6.
  4. ^ So (2007) , теорема 3.3.1, стр. 40
  5. ^ Шенберг, IJ (1935). «Замечания к статье Мориса Фреше« Sur La Definition Axiomatique D'Une Classe D'Espace Vectoriellement, применимый к Sur L'Espace De Hilbert » ». Анналы математики . 36 (3): 724–732. DOI : 10.2307 / 1968654 . ISSN 0003-486X . JSTOR 1968654 .  
  6. ^ Янг, Гейл; Хаусхолдер, А.С. (1938-03-01). «Обсуждение набора точек с точки зрения их взаимных расстояний». Психометрика . 3 (1): 19–22. DOI : 10.1007 / BF02287916 . ISSN 1860-0980 . S2CID 122400126 .  
  7. ^ So (2007) , теорема 2.2.1, стр. 10
  8. ^ So (2007) , следствие 3.3.3, стр. 42
  9. ^ Менгер, Карл (1931). «Новые основы евклидовой геометрии». Американский журнал математики . 53 (4): 721–745. DOI : 10.2307 / 2371222 . JSTOR 2371222 . 
  10. ^ Лемке, Пол; Skiena, Steven S .; Смит, Уоррен Д. (2003). «Реконструкция множеств с промежуточных расстояний». В Аронов, Борис; Басу, Саугата; Пах, Янош; Шарир, Миха (ред.). Дискретная и вычислительная геометрия . 25 . Берлин, Гейдельберг: Springer Berlin Heidelberg. С. 597–631. DOI : 10.1007 / 978-3-642-55566-4_27 . ISBN 978-3-642-62442-1.
  11. ^ Хуанг, Шуай; Докманич, Иван (2020). «Восстановление наборов точек из распределений расстояний». arXiv : 1804.02465 [ cs.DS ].
  12. ^ Jaganathan, Кишор; Хассиби, Бабак (2012). «Восстановление целых чисел по попарным расстояниям». arXiv : 1212.2386 [ cs.DM ].

Ссылки [ править ]

  • Докманич, Иван; Пархизкар, Реза; Раньери, Юри; Веттерли, Мартин (2015). «Матрицы евклидовых расстояний: основная теория, алгоритмы и приложения». Журнал обработки сигналов IEEE . 32 (6): 12–30. arXiv : 1502.07541 . DOI : 10.1109 / MSP.2015.2398954 . ISSN  1558-0792 . S2CID  8603398 .
  • Джеймс Э. Джентл (2007). Матричная алгебра: теория, вычисления и приложения в статистике . Springer-Verlag . п. 299. ISBN 978-0-387-70872-0.
  • Итак, Энтони Ман-Чо (2007). Подход полуопределенного программирования к проблеме реализации графа: теория, приложения и расширения (PDF) (PhD).
  • Либерти, Лев; Лавор, Карлайл; Макулан, Нельсон; Мучерино, Антонио (2014). «Евклидова дистанционная геометрия и приложения». SIAM Обзор . 56 (1): 3–69. arXiv : 1205.0349 . DOI : 10.1137 / 120875909 . ISSN  0036-1445 . S2CID  15472897 .
  • Альфаких, Абдо Ю. (2018). Матрицы евклидовых расстояний и их приложения в теории жесткости . Чам: Издательство Springer International. DOI : 10.1007 / 978-3-319-97846-8 . ISBN 978-3-319-97845-1.