Многомерный анализ ковариации - Multivariate analysis of covariance

Многомерный анализ ковариации (МАНКОВА) является продолжением ковариационный анализ (ANCOVA ) методы, охватывающие случаи, когда существует более одной зависимой переменной и когда контроль сопутствующих непрерывных независимых переменных - ковариаты - необходимо. Наиболее заметное преимущество дизайна MANCOVA по сравнению с простым MANOVA это «факторинг» шум или ошибка, внесенная ковариантом.[1] Часто используемая многовариантная версия ANOVA F-статистика является Лямбда Уилкса (Λ), который представляет собой соотношение между дисперсией ошибки (или ковариацией) и дисперсией эффекта (или ковариацией).[1]

Цели

Как и все тесты в ANOVA семья, основная цель MANCOVA - проверить значимые различия между средними значениями групп.[1]Процесс описания ковариаты в источнике данных позволяет уменьшить величину члена ошибки, представленного в плане MANCOVA как РСошибка. Впоследствии общий Лямбда Уилкса станет больше и с большей вероятностью будет характеризоваться как значительный.[1] Это дает исследователю больше статистическая мощность для обнаружения различий в данных. Многовариантный аспект MANCOVA позволяет характеризовать различия в средних значениях группы в отношении линейной комбинации нескольких зависимых переменных, одновременно контролируя ковариаты.

Пример ситуации, когда подходит MANCOVA:Предположим, ученый заинтересован в испытании двух новых препаратов на предмет их воздействия на депрессию и тревожность. Также предположим, что у ученого есть информация, относящаяся к общей реакции на лекарства для каждого пациента; учитывая это ковариантный предоставит тесту более высокую чувствительность при определении воздействия каждого препарата на обе зависимые переменные.

Предположения

Для правильного использования MANCOVA должны быть соблюдены определенные допущения:

  1. Нормальность: Для каждой группы каждая зависимая переменная должна представлять нормальное распределение очков. Кроме того, любая линейная комбинация зависимых переменных должна иметь нормальное распределение. Преобразование или удаление выбросов может помочь обеспечить выполнение этого предположения.[2] Нарушение этого предположения может привести к увеличению Ошибка типа I тарифы.[3]
  2. Независимость наблюдений: Каждое наблюдение должно быть независимым от всех других наблюдений; это предположение может быть выполнено, если использовать случайная выборка техники. Нарушение этого предположения может привести к увеличению количества ошибок типа I.[3]
  3. Однородность дисперсий: Каждая зависимая переменная должна демонстрировать одинаковые уровни дисперсии по каждой независимой переменной. Нарушение этого предположения можно представить как корреляцию, существующую между дисперсиями и средними значениями зависимых переменных. Это нарушение часто называют "гетероскедастичность '[4] и может быть протестирован на использование Тест Левена.[5]
  4. Однородность ковариаций: Матрица взаимной корреляции между зависимыми переменными должна быть одинаковой на всех уровнях независимой переменной. Нарушение этого предположения может привести к увеличению количества ошибок типа I, а также к снижению статистическая мощность.[3]

Логика MANOVA

Аналогично ANOVA, MANOVA основан на произведении матрицы дисперсии модели, и обратная матрица дисперсии ошибок, , или же . Гипотеза о том, что означает, что продукт .[6] Соображения инвариантности подразумевают, что статистика MANOVA должна быть мерой величина из разложение по сингулярным числам этого матричного продукта, но нет однозначного выбора из-заразмерный природа альтернативной гипотезы.

Самый распространенный[7][8] статистика - это сводка, основанная на корнях (или собственные значения ) из матрица:

распространяется как лямбда (Λ)

Ковариаты

В статистике ковариантный представляет собой источник вариаций, который не контролировался в эксперименте и, как полагают, влияет на зависимую переменную.[9] Цель таких приемов как ANCOVA состоит в том, чтобы устранить эффекты такого неконтролируемого изменения, чтобы увеличить статистическую мощность и гарантировать точное измерение истинной взаимосвязи между независимыми и зависимыми переменными.[9]

Примером может служить анализ тенденций изменения уровня моря Вудвортом (1987). Здесь зависимая переменная (и наиболее интересной переменной) был среднегодовой уровень моря в данном месте, для которого был доступен ряд годовых значений. Первичной независимой переменной было «время». Использовалась «ковариата», состоящая из годовых значений среднегодового атмосферного давления на уровне моря. Результаты показали, что включение ковариаты позволило получить улучшенные оценки тенденции в зависимости от времени по сравнению с анализами, в которых ковариата не использовалась.

Смотрите также

Рекомендации

  1. ^ а б c d [1] Учебник Statsoft, ANOVA / MANOVA.
  2. ^ [2] Френч, А. и др., 2010. Многомерный дисперсионный анализ (MANOVA).
  3. ^ а б c [3] Дэвис, К., 2003. Множественный дисперсионный анализ (MANOVA) или множественный ковариационный анализ (MANCOVA). Государственный университет Луизианы.
  4. ^ [4] Борс, Д. А. Университет Торонто в Скарборо.
  5. ^ [5] Маклафлин, М., 2009. Университет Южной Каролины.
  6. ^ Кэри, Грегори. «Многомерный дисперсионный анализ (MANOVA): I. Теория» (PDF). Получено 2011-03-22.
  7. ^ Гарсон, Дж. Дэвид. «Многомерный GLM, MANOVA и MANCOVA». Получено 2011-03-22.
  8. ^ UCLA: Academic Technology Services, Статистическая консультационная группа. «Аннотированный вывод Stata - MANOVA». Получено 2011-03-22.
  9. ^ а б Кирк, Роджер Э. (1982). Экспериментальная конструкция (2-е изд.). Монтерей, Калифорния: Brooks / Cole Pub. Co. ISBN  0-8185-0286-X.