Анализ соответствия без тренда - Detrended correspondence analysis - Wikipedia

Анализ соответствия без тренда (DCA) многомерный статистический техника, широко используемая экологи найти основные факторы или градиенты в больших, богатых видами, но обычно разреженных матрицах данных, которые типизируют экологическое сообщество данные. DCA часто используется для подавления артефактов, присущих большинству других многомерный анализ когда применяется к градиент данные.[1]

История

DCA была создана в 1979 году Марком Хиллом из Соединенного Королевства Институт экологии суши (ныне объединен в Центр экологии и гидрологии ) и реализован в FORTRAN кодовый пакет под названием DECORANA (Анализ соответствия без тренда), анализ корреспонденции метод. DCA иногда ошибочно называют DECORANA; однако DCA - это базовый алгоритм, а DECORANA - инструмент, реализующий его.

Решенные проблемы

По словам Хилла и Гауча,[2] DCA подавляет два артефакта, присущих большинству других многомерных анализов, когда применяется к градиент данные. Примером может служить временной ряд видов растений, заселяющих новую среду обитания; рано сукцессионные виды сменяются среднесукцессионными видами, затем поздними сукцессионными (см. пример ниже). Когда такие данные анализируются стандартным рукоположение например, анализ соответствия:

  • оценки ординации образцов будут демонстрировать «краевой эффект», то есть дисперсия оценок в начале и в конце регулярной последовательности видов будет значительно меньше, чем в середине,
  • при представлении в виде графика будет видно, что точки следуют подкова в форме кривой, а не в виде прямой линии («эффект дуги»), даже если анализируемый процесс представляет собой устойчивое и непрерывное изменение, которое человеческая интуиция предпочла бы рассматривать как линейный тренд.

За пределами экологии одни и те же артефакты возникают при анализе данных градиента (например, свойства почвы вдоль разреза, проходящего между двумя разными геологическими условиями, или данные о поведении на протяжении жизни человека), потому что криволинейная проекция является точным представлением формы данных в многомерное пространство.

Тер Браак и Прентис (1987, с. 121) цитируют симуляция исследование, в котором анализируются двумерные модели упаковки видов, приводящие к лучшей производительности DCA по сравнению с CA.

Метод

DCA - это итерационный алгоритм это зарекомендовало себя как высоконадежный и полезный инструмент для исследования и обобщения данных в области экологии сообщества (Shaw 2003). Он начинается с выполнения стандартной ординации (CA или обратного усреднения) для данных, чтобы получить начальную кривую подковы, в которой первая ось ординации искажается на вторую ось. Затем он делит первую ось на сегменты (по умолчанию = 26) и масштабирует каждый сегмент так, чтобы среднее значение на второй оси было равно нулю - это фактически сжимает кривую. Он также изменяет масштаб оси, чтобы концы больше не были сжаты относительно середины, так что 1 единица DCA приближается к той же скорости оборота на всем протяжении данных: практическое правило состоит в том, что 4 единицы DCA означают, что есть был общий оборот в сообществе. Тер Браак и Прентис (1987, стр. 122) предостерегают от нелинейного изменения масштаба осей из-за проблем с надежностью и рекомендуют использовать только устранение тренда по полиномам.

Недостатки

Нет тесты значимости доступны с DCA, хотя существует ограниченная (каноническая) версия под названием DCCA, в которой оси принудительно Множественная линейная регрессия оптимально коррелировать с линейная комбинация других (обычно окружающих) переменных; это позволяет протестировать нулевую модель методом Монте-Карло. перестановка анализ.

Пример

В примере показан идеальный набор данных: данные о видах представлены в строках, образцы - в столбцах. Для каждой пробы вдоль градиента вводится новый вид, но другого вида больше нет. В результате получается разреженная матрица. Единицы указывают на присутствие вида в образце. За исключением краев, каждый образец содержит пять видов.

Сравнение анализа соответствия и анализа соответствия без тренда на примере (идеальных) данных. Посмотрите на эффект дуги в CA и его решение в DCA.
Идеальные данные о рукоположении
1234567891011121314151617181920
SP111100000000000000000
SP211110000000000000000
SP311111000000000000000
SP401111100000000000000
SP500111110000000000000
SP600011111000000000000
SP700001111100000000000
SP800000111110000000000
SP900000011111000000000
SP1000000001111100000000
SP1100000000111110000000
SP1200000000011111000000
SP1300000000001111100000
SP1400000000000111110000
SP1500000000000011111000
SP1600000000000001111100
SP1700000000000000111110
SP1800000000000000011111
SP1900000000000000001111
SP2000000000000000000111

График первых двух осей результата анализа соответствия с правой стороны ясно показывает недостатки этой процедуры: краевой эффект, то есть точки сгруппированы по краям первой оси, и эффект дуги.

Смотрите также

Рекомендации

  1. ^ Хилл и Гаух (1980)
  2. ^ Хилл и Гаух (1980)
  • Хилл, М. (1979). DECORANA - программа FORTRAN для анализа соответствия без тренда и взаимного усреднения. Секция экологии и систематики, Корнельский университет, Итака, Нью-Йорк, 52 стр.
  • Хилл, М. и Gauch, H.G. (1980). Анализ соответствия без тренда: усовершенствованный метод распределения. Vegetatio 42, 47–58.
  • Оксанен Дж. И Минчин PR (1997). Нестабильность результатов ординации при изменении порядка входных данных: объяснение и способы устранения. Журнал науки о растительности 8, 447–454
  • Шоу PJA (2003). Многомерная статистика для наук об окружающей среде. Лондон: Ходдер Арнольд
  • Тер Браак, C.J.F. и Prentice, I.C. (1988). Теория градиентного анализа. Успехи в экологических исследованиях 18, 271–371. ISBN  0-12-013918-9. Перепечатано в: Ter Braak, C.J.F. (1987). Унимодальные модели для связи видов с окружающей средой. Вагенинген: кандидатская диссертация по сельскохозяйственной математике, 101–146.

внешняя ссылка