Анализ соответствия без тренда - Detrended correspondence analysis - Wikipedia
Анализ соответствия без тренда (DCA) многомерный статистический техника, широко используемая экологи найти основные факторы или градиенты в больших, богатых видами, но обычно разреженных матрицах данных, которые типизируют экологическое сообщество данные. DCA часто используется для подавления артефактов, присущих большинству других многомерный анализ когда применяется к градиент данные.[1]
История
DCA была создана в 1979 году Марком Хиллом из Соединенного Королевства Институт экологии суши (ныне объединен в Центр экологии и гидрологии ) и реализован в FORTRAN кодовый пакет под названием DECORANA (Анализ соответствия без тренда), анализ корреспонденции метод. DCA иногда ошибочно называют DECORANA; однако DCA - это базовый алгоритм, а DECORANA - инструмент, реализующий его.
Решенные проблемы
По словам Хилла и Гауча,[2] DCA подавляет два артефакта, присущих большинству других многомерных анализов, когда применяется к градиент данные. Примером может служить временной ряд видов растений, заселяющих новую среду обитания; рано сукцессионные виды сменяются среднесукцессионными видами, затем поздними сукцессионными (см. пример ниже). Когда такие данные анализируются стандартным рукоположение например, анализ соответствия:
- оценки ординации образцов будут демонстрировать «краевой эффект», то есть дисперсия оценок в начале и в конце регулярной последовательности видов будет значительно меньше, чем в середине,
- при представлении в виде графика будет видно, что точки следуют подкова в форме кривой, а не в виде прямой линии («эффект дуги»), даже если анализируемый процесс представляет собой устойчивое и непрерывное изменение, которое человеческая интуиция предпочла бы рассматривать как линейный тренд.
За пределами экологии одни и те же артефакты возникают при анализе данных градиента (например, свойства почвы вдоль разреза, проходящего между двумя разными геологическими условиями, или данные о поведении на протяжении жизни человека), потому что криволинейная проекция является точным представлением формы данных в многомерное пространство.
Тер Браак и Прентис (1987, с. 121) цитируют симуляция исследование, в котором анализируются двумерные модели упаковки видов, приводящие к лучшей производительности DCA по сравнению с CA.
Метод
DCA - это итерационный алгоритм это зарекомендовало себя как высоконадежный и полезный инструмент для исследования и обобщения данных в области экологии сообщества (Shaw 2003). Он начинается с выполнения стандартной ординации (CA или обратного усреднения) для данных, чтобы получить начальную кривую подковы, в которой первая ось ординации искажается на вторую ось. Затем он делит первую ось на сегменты (по умолчанию = 26) и масштабирует каждый сегмент так, чтобы среднее значение на второй оси было равно нулю - это фактически сжимает кривую. Он также изменяет масштаб оси, чтобы концы больше не были сжаты относительно середины, так что 1 единица DCA приближается к той же скорости оборота на всем протяжении данных: практическое правило состоит в том, что 4 единицы DCA означают, что есть был общий оборот в сообществе. Тер Браак и Прентис (1987, стр. 122) предостерегают от нелинейного изменения масштаба осей из-за проблем с надежностью и рекомендуют использовать только устранение тренда по полиномам.
Недостатки
Нет тесты значимости доступны с DCA, хотя существует ограниченная (каноническая) версия под названием DCCA, в которой оси принудительно Множественная линейная регрессия оптимально коррелировать с линейная комбинация других (обычно окружающих) переменных; это позволяет протестировать нулевую модель методом Монте-Карло. перестановка анализ.
Пример
В примере показан идеальный набор данных: данные о видах представлены в строках, образцы - в столбцах. Для каждой пробы вдоль градиента вводится новый вид, но другого вида больше нет. В результате получается разреженная матрица. Единицы указывают на присутствие вида в образце. За исключением краев, каждый образец содержит пять видов.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
SP1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP2 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP3 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP4 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP5 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP6 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP7 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP8 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP9 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP10 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP11 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
SP12 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
SP13 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 |
SP14 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
SP15 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
SP16 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 |
SP17 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 |
SP18 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
SP19 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |
SP20 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 |
График первых двух осей результата анализа соответствия с правой стороны ясно показывает недостатки этой процедуры: краевой эффект, то есть точки сгруппированы по краям первой оси, и эффект дуги.
Смотрите также
- Собственный анализ
- Рукоположение (статистика)
- Сериация (археология) - включая дополнительные примеры арочного эффекта
- Анализ главных компонентов
Рекомендации
- Хилл, М. (1979). DECORANA - программа FORTRAN для анализа соответствия без тренда и взаимного усреднения. Секция экологии и систематики, Корнельский университет, Итака, Нью-Йорк, 52 стр.
- Хилл, М. и Gauch, H.G. (1980). Анализ соответствия без тренда: усовершенствованный метод распределения. Vegetatio 42, 47–58.
- Оксанен Дж. И Минчин PR (1997). Нестабильность результатов ординации при изменении порядка входных данных: объяснение и способы устранения. Журнал науки о растительности 8, 447–454
- Шоу PJA (2003). Многомерная статистика для наук об окружающей среде. Лондон: Ходдер Арнольд
- Тер Браак, C.J.F. и Prentice, I.C. (1988). Теория градиентного анализа. Успехи в экологических исследованиях 18, 271–371. ISBN 0-12-013918-9. Перепечатано в: Ter Braak, C.J.F. (1987). Унимодальные модели для связи видов с окружающей средой. Вагенинген: кандидатская диссертация по сельскохозяйственной математике, 101–146.
внешняя ссылка
- ПРОШЛОЕ (ПАЛЕонтологическая статистика) - бесплатное программное обеспечение, включая DCA с модификациями по Оксанену и Минчину (1997)
- WINBASP - бесплатное программное обеспечение, включая DCA с изменением тренда по полиномам согласно Тер Брааку и Прентису (1988)
- веганский: Экологический пакет сообщества за р - бесплатное программное обеспечение, включая функцию decorana: анализ соответствия без тренда и базовое взаимное усреднение от Hill and Gauch (1980)