Радарная диаграмма - Radar chart

Пример звездного графика от НАСА, в центре которого представлены некоторые из наиболее желаемых результатов проектирования.
Эта паутинная диаграмма отображает выделенный бюджет в сравнении с фактическими расходами для данной организации.

А радарная карта это графический метод отображения многомерный данные в виде двумерного Диаграмма трех или более количественных переменных, представленных на осях, начиная с одной и той же точки. Относительное положение и угол осей обычно неинформативны, но для сортировки переменных (осей) по относительным позициям могут применяться различные эвристические методы, такие как алгоритмы, отображающие данные как максимальную общую площадь, что позволяет выявить четкие корреляции, компромиссы и т. Д. и множество других сравнительных мер.[1]

Радарная карта также известна как веб-диаграмма, паук, диаграмма паутины, карта звездного неба,[2] звездный сюжет, паутинная диаграмма, неправильный многоугольник, полярная карта, или же Диаграмма Кивиат.[3][4] Это эквивалентно параллельные координаты участок, с радиально расположенными осями.

Обзор

Радарная карта представляет собой Диаграмма и / или участок который состоит из последовательности спиц с одинаковым углом наклона, называемых радиусами, причем каждая спица представляет собой одну из переменных. Длина данных спицы пропорциональна величине переменной для точки данных относительно максимальной величины переменной для всех точек данных. Проводится линия, соединяющая значения данных для каждой спицы. Это придает сюжету звездный вид и дает начало одному из популярных названий этого сюжета. Звездный сюжет можно использовать для ответа на следующие вопросы:[5]

  • Какие наблюдения наиболее похожи, т.е. есть ли группы наблюдений? (Радиолокационные диаграммы используются для проверки относительных значений для одной точки данных (например, точка 3 большая для переменных 2 и 4, маленькая для переменных 1, 3, 5 и 6) и для определения местоположения похожих или несходных точек.)[5]
  • Есть выбросы?

Радарные диаграммы - удобный способ отображения многомерный наблюдения с произвольным числом переменных.[6] Каждая звезда представляет собой одно наблюдение. Обычно радиолокационные карты создаются в формате с несколькими графиками, на каждой странице которого много звезд, и каждая звезда представляет одно наблюдение.[5] Звездный сюжет впервые использовали Георг фон Майр в 1877 г.[7][8] Радарные карты отличаются от графики с глифами в том, что все переменные используются для построения построенной звездной фигуры. Нет разделения на передний план и фоновые переменные. Вместо этого звездообразные фигуры обычно располагаются на странице в виде прямоугольного массива. Несколько легче увидеть закономерности в данных, если наблюдения расположены в некотором непроизвольном порядке (если переменные присвоены лучам звезды в некотором значимом порядке).[9]

Приложения

Одно из применений радиолокационных карт - это контроль улучшение качества отображать показатели эффективности любой текущей программы.[10]

Они также используются в спорте для обозначения сильных и слабых сторон игроков, где их обычно называют радарными диаграммами.[11]

Ограничения

Радарные карты в первую очередь подходят для яркого отображения выбросы и общность, или когда одна диаграмма больше по каждой переменной, чем другая, и в основном используется для порядковые измерения - где каждая переменная в некотором отношении соответствует «лучшему», а все переменные имеют одинаковую шкалу.

И наоборот, радиолокационные карты критиковались как плохо подходящие для принятия компромиссных решений - когда один график лучше другого по одним переменным, но меньше по другим.[12]

Кроме того, трудно визуально сравнивать длины разных спиц, потому что трудно судить о радиальных расстояниях, хотя концентрические круги помогают в качестве линий сетки. Вместо этого можно использовать простой линейный график, особенно для временных рядов.[13]

Радарные диаграммы могут до некоторой степени искажать данные, особенно когда области заполнены, потому что содержащаяся область становится пропорциональной квадрату линейных мер. Например, на диаграмме с 5 переменными в диапазоне от 1 до 100 область, содержащаяся в многоугольнике, ограниченном 5 точками, когда все меры равны 90, более чем на 10% больше, чем то же самое для диаграммы со всеми значениями 82.

Искусственное сооружение

Радиолокационные диаграммы накладывают на данные несколько структур, которые часто являются искусственными:

  • Связь соседей - радарные диаграммы часто используются, когда соседние переменные не связаны между собой, создавая ложные связи.
  • Циклическая структура - первая и последняя переменные располагаются рядом друг с другом.
  • Длина - переменные чаще всего встречаются наиболее естественно порядковый номер: лучше или хуже, хотя степень различия могут быть искусственными.
  • Площадь - масштаб площади как квадрат значений, преувеличивая эффект больших чисел. Например, 2, 2 занимает площадь в 4 раза больше, чем 1, 1. Это общая проблема с графами с областями, и о площади трудно судить - см. «Иерархия Кливленда».[14]

Например, чередующиеся данные 9, 1, 9, 1, 9, 1 дают диаграмму пикового радара (которая входит и исчезает), а переупорядочивание данных как 9, 9, 9, 1, 1, 1 вместо этого дает два различных клинья (сектора).

В некоторых случаях это естественная структура, и радиолокационные карты могут хорошо подойти. Например, для диаграмм данных, которые меняются в течение 24-часового цикла, почасовые данные естественным образом связаны со своим соседом и имеют циклическую структуру, поэтому их можно естественно отобразить как радарную диаграмму.[13][15][16]

Один набор руководящих принципов по использованию радиолокационных карт (или, скорее, близкородственного «графика полярной области»):[16]

  • вы не против чтения сложенных областей вместо расположения по общей шкале (см. Иерархию Кливленда),
  • набор данных действительно циклический, не линейный, и
  • Существуют два серия к сравнивать, один значительно меньше чем другой

Размер набора данных

Радарные диаграммы полезны для многомерных измерений малых и средних размеров. наборы данных. Их основная слабость заключается в том, что их эффективность ограничена наборами данных с менее чем несколькими сотнями точек. После этого они становятся подавляющими.[5]

Пример

Деталь звездного сюжета Cadillac Seville

График справа[5] содержит звездные сюжеты 15 легковые автомобили. Список переменных для примера звездного графика:

  1. Цена
  2. Пробег (MPG)
  3. Рекорд по ремонту 1978 года (1 = худшее, 5 = лучшее)
  4. Рекорд по ремонту 1977 года (1 = худший, 5 = лучший)
  5. Высота
  6. Заднее сиденье
  7. Багажник
  8. Масса
  9. Длина

Мы можем рассматривать эти графики по отдельности или использовать их для определения групп автомобилей с похожими характеристиками. Например, мы можем посмотреть на звездный график Cadillac Seville (последний на изображении) и увидеть, что это один из самых дорогих автомобилей, расход бензина ниже среднего (но не худший), средний расход топлива. ремонтные записи, вместительность и размер - от среднего до среднего. Затем мы можем сравнить Кадиллак модели (последние три графика) с моделями AMC (первые три графика). Это сравнение показывает четкие закономерности. Модели AMC, как правило, недороги, имеют расход топлива ниже среднего, небольшие по высоте, весу и вместительности. Модели Cadillac дороги, у них плохой расход топлива, они большие по размеру и вместительности.[5]

Альтернативы

Проще всего можно использовать простой линейный график, особенно для временных рядов.[13]

Для качественного графического сравнения двухмерных табличных данных с несколькими переменными распространенной альтернативой является Харви Мячи, которые широко используются Потребительские отчеты.[17] Сравнение в шарах Харви (и радарных диаграммах) может быть значительно облегчено путем алгоритмического упорядочивания переменных для добавления порядка.[18]

Отличный способ визуализации структур в многомерных данных предлагает Анализ главных компонентов (СПС).

Другой альтернативой является использование небольших встроенных гистограмм, которые можно сравнить с спарклайны.[18]

Хотя радиолокационные и полярные карты часто описываются как карты одного и того же типа,[4] некоторые источники делают различие между ними и даже рассматривают радарную карту как вариацию полярной карты, которая не отображает данные в терминах полярных координат.[19]

Смотрите также

Рекомендации

Эта статья включаетматериалы общественного достояния от Национальный институт стандартов и технологий интернет сайт https://www.nist.gov.

  1. ^ Портер, Майкл М; Никсиар, Пуйя (2018). «Многомерная механика: отображение характеристик естественных биологических систем с использованием переставленных радарных диаграмм». PLOS ONE. 13 (9): e0204309. Дои:10.1371 / journal.pone.0204309. ЧВК  6161877. PMID  30265707.
  2. ^ Нэнси Р. Тейг (2005) Набор инструментов качества. стр.437.
  3. ^ Коленс, Кеннет В. (1973). «Эмпирик программного обеспечения». Обзор оценки эффективности ACM SIGMETRICS. 2 (2): 31–36. Дои:10.1145/1113644.1113647. S2CID  18600391. Доктор Филип Дж. Кивиат предложил на недавнем семинаре NBS / ACM по измерению производительности, что круговой график с использованием радиусов в качестве переменных осей может быть полезной формой. […] Я рекомендую называть их «Сюжеты Кивиата» или «Графики Кивиат», чтобы признать его понимание их важности.
  4. ^ а б «Найдите пробелы в содержании с помощью радарных диаграмм». Семинары по контент-стратегии. 3 марта 2015 г.. Получено 17 декабря, 2015.
  5. ^ а б c d е ж NIST / SEMATECH (2003). Звездный сюжет в: Электронный справочник статистических методов. 01.06.2003 (Дата создания)
  6. ^ Чемберс, Джон, Уильям Кливленд, Бит Кляйнер и Пол Тьюки (1983). Графические методы анализа данных. Уодсворт. стр. 158–162
  7. ^ Майр, Георг фон (1877), Die Gesetzmäßigkeit im Gesellschaftsleben (на немецком языке), Мюнхен: Ольденбург, ПР  23294909M, стр.78. Linien-Diagramme im Kreise: линейные диаграммы в кругах.
  8. ^ Майкл Френдли (2008). «Вехи в истории тематической картографии, статистической графики и визуализации данных».
  9. ^ Майкл Френдли (1991). «Статистическая графика для многомерных данных». Документ, представленный на конференции SAS SUGI 16, апрель 1991 г.
  10. ^ Рон Басу (2004). Внедрение качества: практическое руководство по инструментам и методам. с.131.
  11. ^ Spider Graphs: отображение статистики баскетбола
  12. ^ Вы НЕ человек-паук, так почему вы используете радарные диаграммы?, автор: Chandoo, 18 сентября 2008 г.
  13. ^ а б c Пельтье, Джон (14 августа 2008 г.). "Rock Around The Clock - технический блог Пельтье". Peltiertech.com. Получено 2013-09-11.
  14. ^ (Кливленд 1984 ), кратко http://processtrends.com/toc_data_visualization.htm В архиве 25 марта 2010 г. Wayback Machine
  15. ^ «График круглосуточно. Блог о графиках Excel». Excelcharts.com. 2008-08-15. Получено 2013-09-11.
  16. ^ а б Часы Это
  17. ^ «Качественное сравнение». Блог службы поддержки Analytics. 11 декабря 2007. Архивировано с оригинал на 2012-04-08.
  18. ^ а б "Информационный океан: переупорядочиваемые таблицы II: Бертин против пауков". I-ocean.blogspot.com. 2008-09-24. Получено 2013-09-11.
  19. ^ «Полярные диаграммы (построитель отчетов и SSRS)». Сеть разработчиков Microsoft. Получено 17 декабря, 2015.

внешняя ссылка