Многомерная проблема Беренса – Фишера. - Multivariate Behrens–Fisher problem - Wikipedia
В статистика, то многомерная задача Беренса – Фишера это задача проверки равенства средних из двух многомерный нормальный распределения, когда ковариационные матрицы неизвестны и, возможно, не равны. Поскольку это обобщение одномерной Проблема Беренса-Фишера, он унаследовал все трудности, возникающие в одномерной задаче.
Обозначения и постановка задачи
Позволять быть независимыми случайными выборками из двух -вариантные нормальные распределения с неизвестными средними векторами и неизвестно матрицы дисперсии . Индекс относится к первой или второй популяции, а -е наблюдение из -я популяция .
Многомерная задача Беренса – Фишера состоит в проверке нулевой гипотезы что средства равны по сравнению с альтернативой неравенства:
Определите некоторые статистические данные, которые используются в различных попытках решить многомерную задачу Беренса – Фишера, следующим образом:
Образец означает и матрицы суммы квадратов находятся достаточный для многомерных нормальных параметров , поэтому достаточно сделать вывод, основываясь только на этой статистике. Распределения и независимы и соответственно многомерный нормальный и Wishart:[1]
Фон
В случае равенства дисперсионных матриц распределение статистика, как известно, F распределение под нулем и нецентральное F-распределение под альтернативу.[1]
Основная проблема заключается в том, что, когда истинные значения дисперсионной матрицы неизвестны, то при нулевой гипотезе вероятность отклонения через тест зависит от неизвестных дисперсионных матриц.[1] На практике эта зависимость вредит выводам, когда матрицы дисперсии находятся далеко друг от друга или когда размер выборки недостаточно велик для их точной оценки.[1]
Теперь средние векторы распределены независимо и нормально,
но сумма не следует распределению Уишарта,[1] что затрудняет вывод.
Предлагаемые решения
Предлагаемые решения основаны на нескольких основных стратегиях:[2][3]
- Вычислить статистику, имитирующую статистика и которые имеют приблизительную распределение с предполагаемыми степенями свободы (df).
- Использовать обобщенные p-значения на основе обобщенные тестовые переменные.
- Используйте принцип объединения-пересечения Роя [3][4][5]
Подходы с использованием Т2 с приблизительными степенями свободы
Ниже, указывает на оператор трассировки.
Яо (1965)
(цитируется [6])
куда
Йохансен (1980)
(цитируется [6])
куда
и
Нел и Ван дер Мерве (1986)
(цитируется [6])
куда
Комментарии к выступлению
Ким (1992) предложил решение, основанное на варианте . Хотя его мощность высока, тот факт, что он не инвариантен, делает его менее привлекательным. Моделирование, проведенное Субраманиамом и Субраманиамом (1973), показывает, что размер теста Яо ближе к номинальному уровню, чем у Джеймса. Кристенсен и Ренчер (1997) провели численные исследования, сравнивая несколько из этих процедур тестирования, и пришли к выводу, что тесты Ким, Нел и Ван дер Мерве обладают наибольшей мощностью. Однако эти две процедуры не инвариантны.
Кришнамурти и Ю (2004)
Кришнамурти и Ю (2004) предложили процедуру, которая корректирует в Нел и Вар дер Мерве (1986) приблизительную df для знаменателя под нулевым распределением, чтобы сделать его инвариантным. Они показывают, что приблизительные степени свободы лежат в интервалечтобы гарантировать, что степени свободы не отрицательные. Они сообщают о численных исследованиях, которые показывают, что их процедура столь же эффективна, как тест Неля и Ван дер Мерве для меньшего измерения, и более эффективна для большего измерения. В целом они утверждают, что их процедура лучше, чем инвариантные процедуры Яо (1965) и Йохансена (1980). Таким образом, процедура Кришнамурти и Ю (2004) имеет самый известный размер и мощность по состоянию на 2004 год.
Статистика теста в процедуре Кришнмурти и Ю следует распределению куда
Рекомендации
- ^ а б c d е Андерсон, Т. (2003). Введение в многомерный статистический анализ (3-е изд.). Хобокен, Н. Дж .: Wiley Interscience. п. 259. ISBN 0-471-36091-0.
- ^ Christensen, W. F .; А.К. Ренчер (1997). «Сравнение количества ошибок типа I и уровней мощности для семи решений многомерной задачи Беренса – Фишера». Сообщения в статистике. Моделирование и вычисления. 26: 1251–1273. Дои:10.1080/03610919708813439.
- ^ а б Парк, Чжунён; Бимал Синха (2007). Некоторые аспекты многомерной задачи Беренса – Фишера. (PDF) (Технический отчет).
- ^ Олкин, Инграм; Джек Л. Томский (1981). «Новый класс многомерных тестов, основанный на принципе объединения-пересечения». Анна. Стат. 9 (4): 792–802. Дои:10.1214 / aos / 1176345519.
- ^ Gamage, J .; Т. Мэтью; С. Вираханди (2004). «Обобщенные p-значения и обобщенные доверительные области для многомерной задачи Беренса-Фишера и MANOVA». Журнал многомерного анализа. 88: 177–189. Дои:10.1016 / s0047-259x (03) 00065-4.
- ^ а б c Кришнамурти, К .; Дж. Ю (2004). «Модифицированный тест Неля и Ван дер Мерве для многомерной задачи Беренса-Фишера». Статистика и вероятностные письма. 66: 161–169. Дои:10.1016 / j.spl.2003.10.012.
- Родригес-Кортес, Ф. Дж. И Нагар, Д. К. (2007). Процентные баллы для проверки равенства средних векторов. Журнал Нигерийского математического общества, 26:85–95.
- Гупта А. К., Нагар Д. К., Матеу Дж. И Родригес-Кортес Ф. Дж. (2013). Процентные точки тестовой статистики, полезной в manova со структурированными ковариационными матрицами. Журнал прикладной статистической науки, 20:29-41.