Параллельные координаты - Parallel coordinates

Параллельные координаты
Ггоби-блоха2

Параллельные координаты являются распространенным способом визуализации и анализа наборы данных большой размерности.

Чтобы показать набор точки в п-мерное пространство рисуется задник, состоящий из п параллельно линии, как правило, вертикальные и равномерно расположенные. Точка в п-мерное пространство представлено как ломаная линия с вершины по параллельным осям; положение вершины на я-я ось соответствует я-го координировать точки.

Эта визуализация тесно связана с Временные ряды визуализация, за исключением того, что она применяется к данным, оси которых не соответствуют моментам времени и, следовательно, не имеют естественного порядка. Следовательно, может быть интересным другое расположение осей.

История

Часто говорили, что параллельные координаты были изобретены Филбер Морис д'Окань (фр) в 1885 г.,[1] но даже несмотря на то, что в названии книги присутствуют слова «Coordonnées parallèles», эта работа не имеет ничего общего с одноименными методами визуализации; в книге описан только метод преобразования координат. Но даже до 1885 года параллельные координаты использовались, например, в Генри Ганнетте «Общая сводка, показывающая ранг государств в соотношении, 1880 год»,[2] или впоследствии в Генри Ганнетте «Рейтинг штатов и территорий по численности населения при каждой переписи, 1790–1890» в 1898 году. 79 лет спустя они были снова популяризированы Альфред Инзельберг [3] в 1959 г. и систематически развивалась как система координат, начиная с 1977 г. Некоторые важные приложения находятся в алгоритмы предотвращения столкновений за управления воздушным движением (1987 г. - 3 патента США), сбор данных (Патент США), компьютерное зрение (Патент США), Оптимизация, контроль над процессом, совсем недавно в обнаружения вторжений и в другом месте.

Высшие измерения

На плоскости с декартовой системой координат xy добавляем еще размеры в параллельных координатах (часто сокращенно || -коорд или PCP) включает добавление дополнительных осей. Ценность параллельных координат заключается в том, что определенные геометрические свойства в больших размерах преобразуются в легко различимые 2D-модели. Например, набор точек на линии в п-пространство преобразуется в набор полилинии в параллельных координатах все пересекаются в п - 1 балл. За п = 2 это приводит к двойственности точки и линии, указывающей на то, почему математические основы параллельных координат развиваются в проективный скорее, чем евклидов Космос. Пара линий пересекается в уникальной точке, имеющей две координаты, и, следовательно, может соответствовать уникальной линии, которая также определяется двумя параметрами (или двумя точками). Напротив, для задания кривой требуется более двух точек, а также пара кривых может не иметь уникального пересечения. Следовательно, при использовании кривых в параллельных координатах вместо линий двойственность точечных линий утрачивается вместе со всеми другими свойствами проективной геометрии и известными красивыми многомерными паттернами, соответствующими (гипер) плоскостям, кривым, нескольким гладким (гипер) поверхностям. , близости, выпуклости и недавней неориентируемости.[4] Цель состоит в том, чтобы отобразить n-мерные отношения в 2D-шаблоны. Следовательно, параллельные координаты - это не двухточечное отображение, а скорее пОтображение подмножества D в двумерное подмножество, нет потери информации. Примечание: даже точка в nD отображается не в точку в 2D, а в многоугольную линию - подмножество 2D.

Статистические соображения

Репрезентативный образец для параллельных координат.

При использовании для визуализации статистических данных необходимо учитывать три важных аспекта: порядок, поворот и масштабирование осей.

Порядок осей имеет решающее значение для поиска функций, и при типичном анализе данных необходимо будет попробовать множество переупорядочений. Некоторые авторы придумали эвристику упорядочения, которая может создать поясняющую упорядоченность.[5]

Вращение осей - это перенос в параллельных координатах, и если линии пересекаются вне параллельных осей, он может быть перемещен между ними поворотами. Самый простой пример - поворот оси на 180 градусов.[6]

Масштабирование необходимо, потому что график основан на интерполяции (линейной комбинации) последовательных пар переменных.[6] Следовательно, переменные должны иметь общий масштаб, и существует множество методов масштабирования, которые следует рассматривать как часть процесса подготовки данных, которые могут предоставить более информативные представления.

Плавный график параллельных координат достигается с помощью сплайнов.[7] На гладком графике каждое наблюдение отображается в параметрическую линию (или кривую), которая является гладкой, непрерывной по осям и ортогональной каждой параллельной оси. Этот дизайн подчеркивает уровень квантования для каждого атрибута данных.[6]

Чтение

Инзельберг (Инзельберг 1997 ) сделал полный обзор того, как визуально считывать реляционные шаблоны параллельных координат.[8] Когда большинство линий между двумя параллельными осями в некоторой степени параллельны друг другу, это предполагает положительную связь между этими двумя измерениями. Когда линии пересекаются в виде наложения X-образных фигур, это отрицательная взаимосвязь. Когда линии пересекаются случайным образом или параллельны, это показывает, что нет особой взаимосвязи.

Ограничения

В параллельных координатах каждая ось может иметь не более двух соседних осей (одну слева и одну справа). Для d-мерного набора данных одновременно может отображаться не более d-1 отношений. В Временные ряды визуализация, существует естественный предшественник и преемник; поэтому в этом особом случае существует предпочтительное расположение. Однако, когда оси не имеют уникального порядка, поиск хорошего расположения осей требует использования эвристики и экспериментов. Чтобы исследовать более сложные отношения, необходимо изменить порядок осей.

При размещении осей в трехмерном пространстве (однако, все еще параллельно, как гвозди в ногтевом ложе), у оси может быть более двух соседей по кругу вокруг центрального атрибута, и проблема расположения упрощается (например, с помощью используя минимальное остовное дерево ).[9] Прототип этой визуализации доступен как расширение программного обеспечения интеллектуального анализа данных. ELKI. Однако визуализацию сложнее интерпретировать и взаимодействовать с ней, чем с линейным порядком.

Программного обеспечения

Несмотря на то, что существует большое количество статей о параллельных координатах, имеется лишь несколько общедоступных известных программ для преобразования баз данных в графику с параллельными координатами.[10] Известное программное обеспечение ELKI, GGobi, Мондриан, апельсин и КОРЕНЬ. Библиотеки включают Protovis.js, D3.js предоставляет основные примеры. Также был опубликован D3.Parcoords.js (библиотека на основе D3), специально предназначенная для создания графики с параллельными координатами. В Python библиотека структуры данных и анализа Панды реализует построение параллельных координат, используя библиотеку построения matplotlib.[11]

Другие визуализации для многомерных данных

Рекомендации

  1. ^ д'Окань, Морис (1885). Координаты параллельных и осевых: метод геометрического преобразования и нового процесса вычисления графических вычислений для согласования параллельных координационных движений (Coordonnées parallèles et axiales: Méthode de transform géométrique et procédé nouveau de Calcul graphique déduits de la considération des Координаты параллелей). Париж: Готье-Виллар.
  2. ^ Ганнетт, Генри. «Общая сводка, показывающая рейтинг государств по соотношению 1880 г.». Цитировать журнал требует | журнал = (помощь)
  3. ^ Инзельберг, Альфред (1985). «Плоскость с параллельными координатами». Визуальный компьютер. 1 (4): 69–91. Дои:10.1007 / BF01898350.
  4. ^ Инзельберг, Альфред (2009). Параллельные координаты: ВИЗУАЛЬНАЯ многомерная геометрия и ее приложения. Springer. ISBN  978-0387215075.
  5. ^ Ян, Цзин; Пэн, Вэй; Уорд, Мэтью О .; Рунденштайнер, Эльке А. (2003). «Интерактивная иерархическая последовательность измерений и фильтрация для исследования высокоразмерных наборов данных» (PDF). Симпозиум IEEE по визуализации информации (INFOVIS 2003): 3–4.
  6. ^ а б c Мустафа, Рида; Вегман, Эдвард Дж. (2006). «Многомерные непрерывные данные - параллельные координаты». In Unwin, A .; Theus, M .; Хофманн, Х. (ред.). Графика больших наборов данных: визуализация миллиона. Springer. С. 143–156. ISBN  978-0387329062.
  7. ^ Мустафа, Рида; Вегман, Эдвард Дж. (2002). «О некоторых обобщениях параллельных координатных графиков» (PDF). Увидев миллион, семинар по визуализации данных, Рейн-Ам-Лех (Nr.), Германия. Архивировано из оригинал (PDF) на 24.12.2013.
  8. ^ Инзельберг, А. (1997), "Многомерный детектив", Визуализация информации, 1997. Труды., Симпозиум IEEE по, стр. 100–107, Дои:10.1109 / INFVIS.1997.636793, ISBN  0-8186-8189-6
  9. ^ Эльке Ахтерт, Ханс-Петер Кригель, Эрих Шуберт, Артур Зимек (2013). "Интерактивный анализ данных с помощью трехмерных параллельных координатных деревьев". Материалы Международной конференции ACM по управлению данными (SIGMOD). Нью-Йорк, штат Нью-Йорк: 1009. Дои:10.1145/2463676.2463696. ISBN  9781450320375.CS1 maint: несколько имен: список авторов (связь)
  10. ^ Косара, Роберт (2010). «Параллельные координаты».
  11. ^ Параллельные координаты в пандах

дальнейшее чтение

внешняя ссылка