Полиномиальный тест - Multinomial test

В статистика, то полиномиальный тест это испытание нулевая гипотеза что параметры полиномиальное распределение равны указанным значениям. Используется для категориальных данных; см. Рид и Кресси.[1]

Начиная с образца предметы, каждый из которых попадает в одну из категории. Можно определить как наблюдаемое количество предметов в каждой ячейке. Следовательно .

Далее, определение вектора параметров , куда :. Это значения параметров под нулевая гипотеза.

Точная вероятность наблюдаемой конфигурации при нулевой гипотезе дается выражением

Вероятность значимости для теста - это вероятность появления наблюдаемого набора данных или набора данных с меньшей вероятностью, чем наблюдаемый, если нулевая гипотеза верна. Используя точный тест, это рассчитывается как

где сумма колеблется по всем исходам с такой же или меньшей вероятностью, чем наблюдаемые. На практике это становится обременительным с точки зрения вычислений, поскольку и увеличиваются, поэтому, вероятно, стоит использовать точные тесты только для небольших образцов. Для больших выборок асимптотические приближения достаточно точны и их легче вычислить.

Одним из таких приближений является отношение правдоподобия. An Альтернативная гипотеза можно определить, при котором каждое значение заменяется его оценкой максимального правдоподобия . Точная вероятность наблюдаемой конфигурации при альтернативной гипотезе дается

Натуральный логарифм отношения между этими двумя вероятностями, умноженный на тогда статистика для тест отношения правдоподобия

[требуется разъяснение ]

Если нулевая гипотеза верна, то как увеличивается, распределение сходится к хи-квадрат с степени свободы. Однако давно известно (например, Lawley 1956), что для конечных размеров выборки моменты больше, чем у хи-квадрат, что увеличивает вероятность ошибки типа I (ложные срабатывания). Разница между моментами хи-квадрат и моментами тестовой статистики является функцией . Уильямс (1976) показал, что первый момент может быть сопоставлен, насколько это возможно. если статистика теста делится на коэффициент, равный

В частном случае, когда нулевая гипотеза состоит в том, что все значения равны (т.е. он предусматривает равномерное распределение), это упрощает

Впоследствии Smith et al. (1981) вывели делительный множитель, который соответствует первому моменту, насколько . В случае равных значений , этот коэффициент

Нулевая гипотеза также может быть проверена с помощью Критерий хи-квадрат Пирсона

куда ожидаемое количество дел в категории при нулевой гипотезе. Эта статистика также сходится к распределению хи-квадрат с степеней свободы, когда нулевая гипотеза верна, но делает это как бы снизу, а не сверху, как делает, поэтому может быть предпочтительнее неисправленной версии для небольших образцов.[нужна цитата ]

Рекомендации

  1. ^ Рид Т. Р. и Кресси Н. А. С. (1988). Статистика согласия для дискретных многомерных данных. Нью-Йорк: Springer-Verlag. ISBN  0-387-96682-X.
  • Лоули, Д. Н. (1956). «Общий метод приближения к распределению критериев отношения правдоподобия». Биометрика. 43: 295–303. Дои:10.1093 / biomet / 43.3-4.295.
  • Смит, П. Дж., Рэй, Д. С., Мандершайд, Р. В. и Силбергельд, С. (1981). «Аппроксимация моментов и распределение статистики отношения правдоподобия для полиномиального согласия». Журнал Американской статистической ассоциации. Американская статистическая ассоциация. 76 (375): 737–740. Дои:10.2307/2287541. JSTOR  2287541.CS1 maint: несколько имен: список авторов (связь)
  • Уильямс, Д. А. (1976). «Улучшенные тесты отношения правдоподобия для полных таблиц непредвиденных обстоятельств». Биометрика. 63: 33–37. Дои:10.1093 / biomet / 63.1.33.