Матрица евклидовых расстояний - Euclidean distance matrix - Wikipedia

В математика, а Матрица евклидовых расстояний является п×п матрица представляющий интервал набора п точки в Евклидово пространство.Для очков в k-мерное пространство k, элементы их матрицы евклидовых расстояний А даются квадратами расстояний между ними.

куда обозначает Евклидова норма на k.

В контексте (не обязательно евклидова) матрицы расстояний, записи обычно определяются непосредственно как расстояния, а не их квадраты. Однако в евклидовом случае квадраты расстояний используются, чтобы избежать вычисления квадратных корней и упростить соответствующие теоремы и алгоритмы.

Матрицы евклидовых расстояний тесно связаны с Матрицы Грама (матрицы точечные продукты, описывающих нормы векторов и углы между ними), которые легко анализируются методами линейная алгебра Это позволяет характеризовать матрицы евклидовых расстояний и восстанавливать точки Реализация, если она существует, уникальна до жесткие преобразования, т.е. преобразования с сохранением расстояния евклидова пространства (вращения, размышления, переводы ).

В практических приложениях расстояния являются измерениями с зашумлением или происходят от произвольных несходство оценки (не обязательно метрика Целью может быть визуализация таких данных с помощью точек в евклидовом пространстве, матрица расстояний которых максимально приближает данную матрицу несходства - это известно как многомерное масштабирование В качестве альтернативы, учитывая два набора данных, уже представленных точками в евклидовом пространстве, можно спросить, насколько они похожи по форме, то есть насколько тесно они могут быть связаны друг с другом. преобразование с сохранением расстояния - это Прокрустовый анализ.Некоторые расстояния также могут отсутствовать или не иметь маркировки (как неупорядоченный набор или мультимножество вместо матрицы), что приводит к более сложным алгоритмическим задачам, таким как проблема реализации графа или проблема магистрали (для точек на линии).[1][2]

Характеристики

Поскольку евклидово расстояние метрика, матрица А обладает следующими свойствами.

В измерении kматрица евклидовых расстояний имеет классифицировать меньше или равно k+2. Если точки находятся в общая позиция, ранг ровно мин (п, k + 2).

Расстояния можно уменьшить любой степенью, чтобы получить другую матрицу евклидовых расстояний. То есть, если - матрица евклидовых расстояний, то является матрицей евклидовых расстояний для каждого 0<s<1.[3]

Связь с матрицей Грама

В Матрица Грама последовательности точек в k-мерное пространство kэто п×п матрица от их точечные продукты (здесь точка рассматривается как вектор из 0 до этого момента):

, куда угол между вектором и .

Особенно

это квадрат расстояния из 0.

Таким образом, матрица Грама описывает нормы и углы векторов (из 0 к) .

Позволять быть k×п матрица, содержащая столбцами.

, потому что (видя как вектор-столбец).

Матрицы, которые можно разложить как , то есть матрицы Грама некоторой последовательности векторов (столбцов ), хорошо понятны - это именно положительно полуопределенные матрицы.


Чтобы связать матрицу евклидовых расстояний с матрицей Грама, заметьте, что

То есть нормы и углы определяют расстояния. Обратите внимание, что матрица Грама содержит дополнительную информацию: расстояния от 0.

И наоборот, расстояния между парами п+1 точки определять точечные произведения между п векторов (1≤яп):

(это известно как поляризационная идентичность ).

Характеристики

Для п×п матрица А, последовательность точек в k-мерное евклидово пространство kназывается реализация из А в k если А - их евклидова матрица расстояний. Без ограничения общности можно считать, что (потому что Идет перевод к сохраняет расстояния).

Теорема[4] (Критерий Шенберга,[5]Независимо продемонстрировано Young & Householder[6]) — Симметричный пустой п×п матрица А с реальными записями допускает реализацию в k если и только если (п-1)×(п-1) матрица определяется

является положительно полуопределенный и имеет классифицировать в большинстве k.

Это следует из предыдущего обсуждения, потому что грамм положительно полуопределенный ранг не выше k тогда и только тогда, когда его можно разложить как куда Икс является k×п матрица.[7]Кроме того, столбцы Икс дать реализацию в k.Поэтому любой способ разложить грамм позволяет найти реализацию. Два основных подхода - это варианты Разложение Холецкого или используя спектральные разложения найти главный квадратный корень из грамм, видеть Определенная матрица # Разложение.

Утверждение теоремы выделяет первый пункт . Более симметричный вариант той же теоремы следующий:

Следствие[8] — Симметричный пустой п×п матрица А с вещественными элементами допускает реализацию тогда и только тогда, когда Аотрицательно полуопределено на гиперплоскости , то есть

для всех такой, что .

Другие характеристики включают Детерминанты Кэли-Менгера В частности, они позволяют показать, что симметричная пустой п×п матрица реализуема в k если и только если каждый (k+3)×(k+3) главная подматрица Другими словами, полуметрический на конечном числе точек встраиваться изометрически в k если и только если каждый k+3 точки есть.[9]

На практике условия определенности или ранга могут не выполняться из-за численных ошибок, шума в измерениях или из-за того, что данные не поступают из фактических евклидовых расстояний. Точки, которые реализуют оптимально похожие расстояния, могут быть затем найдены с помощью полуопределенного приближения (и приближения низкого ранга, при желании) с использованием линейных алгебраических инструментов, таких как разложение по сингулярным числам или же полуопределенное программирование Это известно как многомерное масштабирование. Варианты этих методов также могут иметь дело с неполными данными о расстоянии.

С немаркированными данными, то есть с набором или мультимножеством расстояний, не назначенных конкретным парам, гораздо труднее иметь дело. Такие данные возникают, например, в Секвенирование ДНК (в частности, восстановление генома из частичный дайджест ) или же восстановление фазы.Два набора точек называются гомометрический если они имеют одно и то же мультимножество расстояний (но не обязательно связаны жестким преобразованием). п(п-1)/2 расстояния могут быть реализованы в заданном измерении k является сильно NP-жесткий.В одном измерении это известно как проблема магистрали; это открытый вопрос, можно ли его решить за полиномиальное время. Когда мультимножество расстояний дается с планками ошибок, даже одномерный случай NP-жесткий Тем не менее, практические алгоритмы существуют для многих случаев, например случайные точки.[10][11][12]

Уникальность представлений

Учитывая евклидову матрицу расстояний, последовательность точек, реализующих ее, уникальна с точностью до жесткие преобразования - это изометрии евклидова пространства: вращения, размышления, переводы, и их составы.[1]

Теорема — Позволять и две последовательности точек в k-мерное евклидово пространство k.Расстояния и равны (для всех 1≤я,jп) тогда и только тогда, когда существует жесткое преобразование k отображение к (для всех 1≤яп).

Доказательство

Жесткие преобразования сохраняют расстояния, поэтому одно направление остается четким. и равны. Без ограничения общности можно считать переводя точки на и соответственно. (п-1)×(п-1) Матрица Грама оставшихся векторов идентична матрице Грама векторов (2≤яп).То есть, , куда Икс и Y являются k×(п-1) матрицы, содержащие соответствующие векторы в виде столбцов. Это означает, что существует ортогональный k×k матрица Q такой, что QX=Y, видеть Определенная симметричная матрица # Единственность с точностью до унитарных преобразований.Q описывает ортогональное преобразование из k (композиция вращений и отражений без переводов), которая отображает к 0 к 0Окончательное жесткое преобразование описывается формулой .


В приложениях, когда расстояния не совпадают точно, Прокрустовый анализ стремится связать два набора точек как можно ближе с помощью жестких преобразований, обычно используя разложение по сингулярным числам Обычный евклидов случай известен как ортогональная проблема Прокруста или же Проблема вахбы (когда наблюдения взвешиваются для учета различных неопределенностей). Примеры приложений включают определение ориентации спутников, сравнение структуры молекул (в хеминформатика ), белковая структура (структурное выравнивание в биоинформатика ) или костную структуру (статистический анализ формы в биологии).

Смотрите также

Примечания

  1. ^ а б Dokmanic et al. (2015)
  2. ^ Итак (2007)
  3. ^ Маэхара, Хироши (2013). «Евклидовы вложения конечных метрических пространств». Дискретная математика. 313 (23): 2848–2856. Дои:10.1016 / j.disc.2013.08.029. ISSN  0012-365X. Теорема 2.6.
  4. ^ Итак (2007), Теорема 3.3.1, с. 40
  5. ^ Шенберг, И. Дж. (1935). «Замечания к статье Мориса Фреше» Sur La Definition Axiomatique D'Une Classe D'Espace Vectoriellement, применимый к Sur L'Espace De Hilbert"". Анналы математики. 36 (3): 724–732. Дои:10.2307/1968654. ISSN  0003-486X. JSTOR  1968654.
  6. ^ Янг, Гейл; Домохозяин, А.С. (1938-03-01). «Обсуждение набора точек с точки зрения их взаимных расстояний». Психометрика. 3 (1): 19–22. Дои:10.1007 / BF02287916. ISSN  1860-0980. S2CID  122400126.
  7. ^ Итак (2007), Теорема 2.2.1, с. 10
  8. ^ Итак (2007), Следствие 3.3.3, с. 42
  9. ^ Менгер, Карл (1931). «Новые основы евклидовой геометрии». Американский журнал математики. 53 (4): 721–745. Дои:10.2307/2371222. JSTOR  2371222.
  10. ^ Лемке, Пол; Skiena, Steven S .; Смит, Уоррен Д. (2003). «Реконструкция множеств по промежуточным расстояниям». В Аронов, Борис; Басу, Саугата; Пах, Янош; Шарир, Миха (ред.). Дискретная и вычислительная геометрия. 25. Берлин, Гейдельберг: Springer Berlin Heidelberg. С. 597–631. Дои:10.1007/978-3-642-55566-4_27. ISBN  978-3-642-62442-1.
  11. ^ Хуанг, Шуай; Докманич, Иван (2020). «Восстановление наборов точек из распределений расстояний». arXiv:1804.02465 [cs.DS ].
  12. ^ Джаганатан, Кишор; Хассиби, Бабак (2012). «Восстановление целых чисел по попарным расстояниям». arXiv:1212.2386 [cs.DM ].

Рекомендации