Многовариантная статистика - Multivariate statistics

Многовариантная статистика является подразделением статистика охватывающий одновременное наблюдение и анализ более чем одной переменной результата. Применение многомерной статистики многомерный анализ.

Многомерная статистика касается понимания различных целей и основ каждой из различных форм многомерного анализа и того, как они соотносятся друг с другом. Практическое применение многомерной статистики к конкретной проблеме может включать несколько типов одномерного и многомерного анализа, чтобы понять отношения между переменными и их отношение к изучаемой проблеме.

Кроме того, многомерная статистика связана с многомерными распределения вероятностей, с точки зрения как

  • как их можно использовать для представления распределения наблюдаемых данных;
  • как их можно использовать как часть статистические выводы, особенно если для одного анализа представляют интерес несколько разных величин.

Некоторые типы проблем, связанных с многомерными данными, например простая линейная регрессия и множественная регрессия, находятся нет обычно считается частным случаем многомерной статистики, поскольку анализ проводится путем рассмотрения (одномерного) условного распределения одной переменной результата с учетом других переменных.

Виды анализа

Существует много разных моделей, каждая из которых имеет свой тип анализа:

  1. Многомерный дисперсионный анализ (MANOVA) расширяет дисперсионный анализ чтобы охватить случаи, когда необходимо одновременно анализировать более одной зависимой переменной; смотрите также Многомерный анализ ковариации (МАНКОВА).
  2. Многомерная регрессия пытается определить формулу, которая может описывать, как элементы вектора переменных одновременно реагируют на изменения в других. Для линейных отношений регрессионный анализ здесь основан на формах общая линейная модель. Некоторые предполагают, что многомерная регрессия отличается от многомерной регрессии, однако это обсуждается и не всегда верно в разных областях науки.[1]
  3. Анализ основных компонентов (PCA) создает новый набор ортогональных переменных, которые содержат ту же информацию, что и исходный набор. Он вращает оси вариации, чтобы получить новый набор ортогональных осей, упорядоченных так, чтобы они суммировали уменьшающиеся пропорции вариации.
  4. Факторный анализ аналогичен PCA, но позволяет пользователю извлекать указанное количество синтетических переменных, меньшее, чем исходный набор, оставляя оставшееся необъяснимое изменение как ошибку. Извлеченные переменные известны как скрытые переменные или факторы; Предполагается, что каждый из них учитывает ковариацию в группе наблюдаемых переменных.
  5. Канонический корреляционный анализ находит линейные отношения между двумя наборами переменных; это обобщенная (т.е. каноническая) версия двумерной[2] корреляция.
  6. Анализ избыточности (RDA) аналогичен каноническому корреляционному анализу, но позволяет пользователю получить указанное количество синтетических переменных из одного набора (независимых) переменных, которые объясняют как можно большую дисперсию в другом (независимом) наборе. Это многомерный аналог регресс.
  7. Анализ корреспонденции (CA), или взаимное усреднение, находит (как и PCA) набор синтетических переменных, которые суммируют исходный набор. Базовая модель предполагает несходство хи-квадрат среди записей (наблюдений).
  8. Канонический (или "ограниченный") анализ соответствия (CCA) для резюмирования совместной вариации двух наборов переменных (например, анализ избыточности); сочетание анализа соответствия и многомерного регрессионного анализа. Базовая модель предполагает несходство хи-квадрат среди записей (наблюдений).
  9. Многомерное масштабирование содержит различные алгоритмы для определения набора синтетических переменных, которые наилучшим образом представляют попарные расстояния между записями. Оригинальный метод анализ главных координат (PCoA; на основе PCA).
  10. Дискриминантный анализ, или канонический вариативный анализ, пытается установить, можно ли использовать набор переменных для различения двух или более групп наблюдений.
  11. Линейный дискриминантный анализ (LDA) вычисляет линейный предиктор из двух наборов нормально распределенных данных для классификации новых наблюдений.
  12. Системы кластеризации назначать объекты в группы (называемые кластерами), чтобы объекты (случаи) из одного кластера были более похожи друг на друга, чем объекты из разных кластеров.
  13. Рекурсивное разбиение создает дерево решений, которое пытается правильно классифицировать членов совокупности на основе дихотомической зависимой переменной.
  14. Искусственные нейронные сети распространить методы регрессии и кластеризации на нелинейные многомерные модели.
  15. Статистическая графика такие как туры, графики в параллельных координатах матрицы диаграммы рассеяния могут использоваться для исследования многомерных данных.
  16. Модели одновременных уравнений включают более одного уравнения регрессии с разными зависимыми переменными, оцениваемыми вместе.
  17. Векторная авторегрессия предполагает одновременную регрессию различных Временные ряды переменные сами по себе и значения друг друга с запаздыванием.
  18. Основные кривые отклика Анализ (PRC) - это метод, основанный на RDA, который позволяет пользователю сосредоточиться на эффектах лечения с течением времени, корректируя изменения в контрольных обработках с течением времени.[3]

Важные распределения вероятностей

Есть набор распределения вероятностей используется в многомерном анализе, который играет роль, аналогичную соответствующему набору распределений, используемых в одномерный анализ когда нормальное распределение подходит для набора данных. Вот эти многомерные распределения:

В Обратное распределение Уишарта важно в Байесовский вывод, например в Байесовская многомерная линейная регрессия. Кроме того, Распределение Т-квадрата Хотеллинга - многомерное распределение, обобщающее Распределение Стьюдента, который используется в многомерном проверка гипотезы.

История

Учебник Андерсона 1958 года, Введение в многомерный анализ,[4] воспитал поколение теоретиков и прикладных статистиков; В книге Андерсона подчеркивается проверка гипотезы через тесты отношения правдоподобия и свойства степенные функции: допустимость, непредвзятость и монотонность.[5][6]

Программное обеспечение и инструменты

Существует огромное количество программных пакетов и других инструментов для многомерного анализа, в том числе:

Смотрите также

Рекомендации

  1. ^ Идальго, B; Гудман, М. (2013). "Многомерная или многомерная регрессия?". Am J Public Health. 103: 39–40. Дои:10.2105 / AJPH.2012.300897. ЧВК  3518362. PMID  23153131.
  2. ^ Неискушенные аналитики двумерных гауссовских задач могут найти полезными грубые, но точные метод точной оценки вероятности, просто взяв сумму S из N квадраты остатков, вычитая сумму См как минимум, разделив эту разницу на См, умножая результат на (N - 2) и взяв обратное анти-ln половины этого произведения.
  3. ^ тер Браак, Кахо Й.Ф. и Шмилауэр, Петр (2012). Справочное руководство и руководство пользователя Canoco: программное обеспечение для ординации (версия 5.0), стр.292. Microcomputer Power, Итака, штат Нью-Йорк.
  4. ^ T.W. Андерсон (1958) Введение в многомерный анализ, Нью-Йорк: Wiley ISBN  0471026409; 2e (1984) ISBN  0471889873; 3e (2003) ISBN  0471360910
  5. ^ Сен, Пранаб Кумар; Андерсон, Т. У .; Арнольд, С. Ф .; Eaton, M. L .; Giri, N.C .; Gnanadesikan, R .; Kendall, M. G .; Kshirsagar, A.M .; и другие. (Июнь 1986 г.). «Обзор: Современные учебники по многомерному статистическому анализу: панорамная оценка и критика». Журнал Американской статистической ассоциации. 81 (394): 560–564. Дои:10.2307/2289251. ISSN  0162-1459. JSTOR  2289251.(Страницы 560–561)
  6. ^ Шервиш, Марк Дж. (Ноябрь 1987 г.). «Обзор многомерного анализа». Статистическая наука. 2 (4): 396–413. Дои:10.1214 / сс / 1177013111. ISSN  0883-4237. JSTOR  2245530.
  7. ^ КРАН содержит подробную информацию о пакетах, доступных для многомерного анализа данных

дальнейшее чтение

  • Джонсон, Ричард А .; Уичерн, Дин В. (2007). Прикладной многомерный статистический анализ (Шестое изд.). Прентис Холл. ISBN  978-0-13-187715-3.CS1 maint: ref = harv (связь)
  • КВ Мардиа; Дж. Т. Кент; Дж. М. Бибби (1979). Многомерный анализ. Академическая пресса. ISBN  0-12-471252-5.
  • А. Сен, М. Шривастава, Регрессионный анализ - теория, методы и приложения, Springer-Verlag, Берлин, 2011 (4-е издание).
  • Кук, Суэйн (2007). Интерактивная графика для анализа данных.
  • Малакути, Б. (2013). Операционные и производственные системы с множеством целей. Джон Вили и сыновья.

внешняя ссылка