Точный тест - Exact test

В статистика, точный (значимый) тест это тест, где если нулевая гипотеза верно тогда все предположения, на основании чего вывод распределения статистика теста основано, выполнены. Использование точного теста дает тест значимости что сохраняет Частота ошибок типа I теста () на желаемом уровне значимости теста. Например точный тест на уровень значимости из , при повторении теста на многих образцах, где нулевые гипотезы верно, отклонит самое большее времени. Это противоположно приблизительный тест в котором желаемая частота ошибок типа I сохраняется только приблизительно (то есть: тест может отклонять более 5% времени), в то время как это приближение может быть сделано как можно ближе к по желанию, сделав размер выборки достаточно большим.

Точные тесты, основанные на дискретных статистика теста могут быть консервативными тестами, т. е. то, что его фактический уровень отклонения ниже номинального уровня значимости . Например, это случай Точный тест Фишера а также его более мощная альтернатива, Тест Босхлоо. Если статистика теста непрерывна, она точно достигнет уровня значимости.[нужна цитата ].

Параметрические тесты, например, описанные в точная статистика, являются точными тестами, когда параметрические допущения полностью выполняются, но на практике термин точный (значимость) тестовое задание зарезервирован для тех тестов, которые не основываются на параметрических допущениях - непараметрические тесты[нужна цитата ]. Однако на практике в большинстве реализаций программного обеспечения непараметрического тестирования используются асимптотические алгоритмы для получения значения значимости, что делает выполнение теста неточным.

Поэтому, когда результат статистического анализа называется «точным тестом» или «точным p-значение ”, Это должно означать, что тест определяется без параметрических предположений и оценивается без использования приближенных алгоритмов. В принципе, однако, это также может означать, что параметрический тест использовался в ситуации, когда все параметрические допущения полностью выполняются, но в большинстве случаев невозможно полностью доказать это в реальной ситуации. Исключения, когда точно известно, что параметрические тесты точны, включают тесты, основанные на биномиальном распределении или распределении Пуассона. Иногда перестановочный тест используется как синоним точного теста, но хотя все тесты перестановки являются точными тестами, не все точные тесты являются тестами перестановок.

Точные тесты

Основное уравнение, лежащее в основе точных тестов:

куда:

  • Икс действительно ли результат наблюдается,
  • Pr (у) - вероятность потенциально наблюдаемого результата при нулевой гипотезе у,
  • Т(у) - значение тестовой статистики для результата у, с большими значениями Т представляющие случаи, которые теоретически представляют собой большие отклонения от нулевой гипотезы,

и где сумма колеблется по всем исходам у (включая наблюдаемую), которые имеют такое же значение тестовой статистики, как полученная для наблюдаемой выборки Икс, или более крупный.

Пример: критерий хи-квадрат Пирсона в сравнении с точным критерием.

Простой пример повода для этой концепции можно увидеть, заметив, что Критерий хи-квадрат Пирсона это приблизительный тест. Предположим, что критерий хи-квадрат Пирсона используется для проверки того, является ли шестигранный кубик «справедливым», т. Е. Дает каждый из шести результатов одинаково часто. Если кость брошена п раз, затем один "ожидает" видеть каждый результат п/ 6 раз. Статистика теста

куда Иксk это количество раз результат k наблюдается. Если нулевая гипотеза «справедливости» верна, то распределение вероятностей статистики теста можно сделать как можно ближе к распределению хи-квадрат с 5 степенями свободы, сделав размер выборки п достаточно большой. Но если п мала, то вероятности, основанные на распределениях хи-квадрат, могут не быть очень близкими приближениями. Для определения точной вероятности того, что эта тестовая статистика превышает определенное значение, затем требуется комбинаторное перечисление всех результатов эксперимента, которые приводят к такому большому значению тестовой статистики. Более того, возникает вопрос, следует ли использовать одну и ту же статистику теста. А критерий отношения правдоподобия может быть предпочтительнее как больше мощный, и тестовая статистика может не быть монотонной функцией приведенной выше.

Пример: точный тест Фишера

Точный тест Фишера, основанный на работе Рональд Фишер и Э. Дж. Г. Питман в 1930-х гг. является точным, потому что распределение выборки (в зависимости от маргиналов) точно известно. Сравнивать Критерий хи-квадрат Пирсона, который (хотя и проверяет тот же самый null) не является точным, потому что распределение тестовой статистики верно только асимптотически.

Смотрите также

Рекомендации

  • Рональд Фишер (1954) Статистические методы для научных работников. Оливер и Бойд.
  • Mehta, C.R.; Патель, Н. (1998). «Точный вывод для категориальных данных». В P. Armitage and T. Colton, eds., Энциклопедия биостатистики, Чичестер: Джон Вили, стр. 1411–1422. неопубликованный препринт
  • Corcoran, C.D .; Senchaudhuri, P .; Mehta, C.R .; Патель, Н. Р. (2005). «Точный вывод для категориальных данных». Энциклопедия биостатистики. Дои:10.1002 / 0470011815.b2a10019. ISBN  047084907X.