Диаграмма Тейлора - Taylor diagram

Диаграммы Тейлора находятся математические диаграммы предназначен для графического обозначения того, какое из нескольких приблизительных представлений (или моделей) системы, процесса или явления является наиболее реалистичным. Эта диаграмма, изобретенная Карлом Э. Тейлором в 1994 г. (опубликована в 2001 г.[1]) облегчает сравнительную оценку различных моделей. Он используется для количественной оценки степени соответствия между смоделированным и наблюдаемым поведением с точки зрения трех статистических показателей: Коэффициент корреляции Пирсона, то Средняя квадратическая ошибка (RMSE), а среднеквадратичное отклонение.

Хотя диаграммы Тейлора в основном использовались для оценки моделей, предназначенных для изучения климата и других аспектов окружающей среды Земли,[2] их можно использовать для целей, не связанных с наукой об окружающей среде (например, для количественной оценки и визуального отображения того, насколько хорошо модели термоядерной энергии отражают реальность[3]).

Диаграммы Тейлора могут быть построены с помощью ряда различных пакетов программного обеспечения с открытым исходным кодом и коммерческих программ, включая: GrADS,[4][5] IDL,[6] MATLAB,[7][8][9] NCL,[10] Python,[11] Р,[12] и УФ-CDAT.[13]

Схема образца

Примерная диаграмма Тейлора, показанная на рисунке 1[14] дается сводка относительных навыков, с которыми несколько глобальных климатических моделей моделируют пространственный характер среднегодовых осадков. Сравниваются восемь моделей, каждая из которых обозначена отдельной буквой на диаграмме, и расстояние между каждой моделью и точкой, помеченной как «наблюдаемая», является мерой того, насколько реалистично каждая модель воспроизводит наблюдения. Для каждой модели нанесены три статистики: коэффициент корреляции Пирсона (оценка сходства в картине между моделируемым и наблюдаемым полями) связан с азимутальным углом (синие контуры); центрированная среднеквадратичная ошибка в моделируемом поле пропорциональна расстоянию от точки на оси x, обозначенной как «наблюдаемая» (зеленые контуры); и стандартное отклонение моделируемого шаблона пропорционально радиальному расстоянию от начала координат (черные контуры). Из этой диаграммы, например, видно, что для модели F коэффициент корреляции составляет около 0,65, среднеквадратичная ошибка составляет около 2,6 мм / день, а стандартное отклонение составляет около 3,3 мм / день. Стандартное отклонение модели F явно больше стандартного отклонения наблюдаемого поля (обозначено пунктирным контуром на радиальном расстоянии 2,9 мм / день).

Рис. 1: Пример диаграммы Тейлора, отображающий статистическое сравнение с наблюдениями восьми модельных оценок глобальной структуры среднегодовых осадков.

Относительные достоинства различных моделей можно вывести из рисунка 1. Смоделированные модели, которые хорошо согласуются с наблюдениями, будут располагаться ближе всего к точке, отмеченной «наблюдаемой» на оси абсцисс. Эти модели имеют относительно высокую корреляцию и низкие среднеквадратичные ошибки. Модели, лежащие на пунктирной дуге, имеют правильное стандартное отклонение (что указывает на то, что вариации модели имеют правильную амплитуду). На рисунке 1 можно увидеть, что модели A и C в целом лучше всего согласуются с наблюдениями, каждая из которых имеет примерно одинаковую среднеквадратичную ошибку. Модель A, однако, имеет немного более высокую корреляцию с наблюдениями и имеет то же стандартное отклонение, что и наблюдаемое, тогда как модель C имеет слишком небольшую пространственную изменчивость (со стандартным отклонением 2,3 мм / день по сравнению с наблюдаемым значением 2,9 мм / день. ). Из менее эффективных моделей модель E имеет низкую корреляцию с моделями, в то время как модель D имеет вариации, которые намного больше, чем наблюдаемые, в обоих случаях приводя к относительно большой (~ 3 мм / день) центрированной среднеквадратичной ошибке в полях осадков. Хотя модели D и B имеют примерно одинаковую корреляцию с наблюдениями, модель B моделирует амплитуду вариаций (т. Е. Стандартное отклонение) намного лучше, чем модель D, что приводит к меньшей среднеквадратичной ошибке.

Теоретические основы

Диаграммы Тейлора отображают статистику, полезную для оценки сходства переменной, моделируемой моделью (в более общем смысле, «тестовое» поле), с ее наблюдаемым аналогом (в более общем смысле, «эталонным» полем). Математически три статистики, отображаемые на диаграмме Тейлора, связаны следующей формулой (которая может быть получена непосредственно из определения статистики, представленной в ней):

,

где ρ - коэффициент корреляции между тестовым и эталонным полями, E′ - это центрированная среднеквадратичная разница между полями (с любой разницей в сначала удаленных средних), и и - дисперсии эталонного и тестового полей соответственно. В закон косинусов где а, б, и c - длины сторон треугольника, а φ угол между сторонами а и б) обеспечивает ключ к формированию геометрической взаимосвязи между четырьмя величинами, лежащими в основе диаграммы Тейлора (показанной на рисунке 2).

Рис. 2: Геометрическая зависимость между статистическими данными, нанесенными на диаграммы Тейлора в соответствии с законом косинусов.

Стандартное отклонение наблюдаемого поля сторона а. В среднеквадратичное отклонение моделируемого поля сторона б, в центре RMS разница между двумя полями (E′) Сторона c, а косинус угла между сторонами а и б это коэффициент корреляции (ρ).

Средние значения полей вычитаются перед вычислением их статистики второго порядка, поэтому диаграмма не предоставляет информацию об общих смещениях, а только характеризует ошибку центрированного шаблона.

Варианты диаграммы Тейлора

Среди нескольких предложенных незначительных изменений диаграммы (см. Taylor, 2001[1]):

  • расширение до второго «квадранта» (слева от квадранта, показанного на рисунке 1), чтобы учесть отрицательные корреляции;
  • нормализация размерных величин (деление как среднеквадратичной разницы, так и стандартного отклонения «тестового» поля на стандартное отклонение наблюдений) так, чтобы «наблюдаемая» точка была нанесена на единицу расстояния от начала координат по оси x, и статистика для разных полей (с разными единицами измерения) может отображаться на одном графике;
  • пропуск изолиний на диаграмме, чтобы было удобнее видеть нанесенные точки;
  • использование стрелки для соединения двух связанных точек на диаграмме. Например, стрелка может быть проведена от точки, представляющей старую версию модели, к более новой версии, что позволяет более четко указать, движется ли модель к «истине», как это определено наблюдениями.

Рекомендации

  1. ^ а б Тейлор, К. (2001). «Обобщение нескольких аспектов производительности модели на одной диаграмме». J. Geophys. Res. 106: 7183–7192. Bibcode:2001JGR ... 106.7183T. Дои:10.1029 / 2000JD900719.
  2. ^ В период с 2015 по 2018 год Google Scholar перечисляет более 1500 цитирований Тейлора (2001), первой рецензируемой научной статьи с описанием диаграммы Тейлора.
  3. ^ Терри, P.W .; и другие. (2008). «Валидация в исследованиях термоядерного синтеза: на пути к руководящим принципам и передовой практике». Phys. Плазма. 15. arXiv:0801.2787. Bibcode:2008ФПЛ ... 15Ф2503Т. Дои:10.1063/1.2928909.
  4. ^ Вычислить статистику, используемую в диаграмме Тейлора в GrADS
  5. ^ Постройте диаграмму Тейлора в GrADS
  6. ^ Руководство Coyote по программированию на IDL: создание диаграммы Тейлора
  7. ^ Обмен файлами MathWorks: диаграмма Тейлора
  8. ^ Обмен файлами MathWorks: набор инструментов для оценки навыков
  9. ^ GitHub: SkillMetricsToolbox
  10. ^ Специальные темы NCL: Диаграмма Тейлора
  11. ^ GitHub: SkillMetrics
  12. ^ Пакет программ R plotrix
  13. ^ CDAT: диаграммы Тейлора
  14. ^ Праймер по диаграмме Тейлора (2005), K.E. Тейлор