Поправка Ятесса на непрерывность - Yatess correction for continuity - Wikipedia
В статистика, Поправка Йетса на непрерывность (или же Тест хи-квадрат Йейтса) используется в определенных ситуациях при тестировании на независимость в Таблица сопряженности. Он направлен на исправление ошибки, введенной путем предположения, что дискретные вероятности частот в таблице могут быть аппроксимированы непрерывным распределением (хи-квадрат ). В некоторых случаях поправка Йетса может слишком сильно подстраиваться, и поэтому ее текущее использование ограничено.
Поправка на ошибку аппроксимации
С использованием распределение хи-квадрат интерпретировать Статистика хи-квадрат Пирсона требует предположить, что дискретный вероятность наблюдаемого биномиальные частоты в таблице можно аппроксимировать непрерывным распределение хи-квадрат. Это предположение не совсем верно и вносит некоторую ошибку.
Чтобы уменьшить ошибку приближения, Фрэнк Йейтс, английский статистик, предложил поправку на непрерывность, которая корректирует формулу для Критерий хи-квадрат Пирсона путем вычитания 0,5 из разницы между каждым наблюдаемым значением и его ожидаемым значением в таблице непредвиденных обстоятельств 2 × 2.[1] Это уменьшает полученное значение хи-квадрат и, таким образом, увеличивает его p-значение.
Эффект поправки Йетса состоит в том, чтобы предотвратить переоценку статистической значимости небольших данных. Эта формула в основном используется, когда хотя бы одна ячейка таблицы имеет ожидаемое количество меньше 5. К сожалению, поправка Йейтса может иметь тенденцию к чрезмерной корректировке. Это может привести к чрезмерно консервативному результату, не позволяющему отвергнуть нулевая гипотеза когда это должно (a ошибка типа II ). Таким образом, предполагается, что поправка Йейтса не нужна даже при довольно малых размерах выборки,[2] Такие как:
Ниже приводится исправленная версия Йейтса. Статистика хи-квадрат Пирсона:
куда:
- Оя = наблюдаемая частота
- Eя = ожидаемая (теоретическая) частота, утвержденная нулевой гипотезой
- N = количество различных событий
Стол 2 × 2
В качестве сокращения для таблицы 2 × 2 со следующими записями:
S | F | ||
---|---|---|---|
А | а | б | NА |
B | c | d | NB |
NS | NF | N |
мы можем написать
В некоторых случаях так лучше.
Смотрите также
Рекомендации
- ^ Йейтс, Ф (1934). "Таблица непредвиденных обстоятельств с малыми числами и χ2 тест". Дополнение к Журнал Королевского статистического общества 1(2): 217–235. JSTOR 2983604
- ^ Сокал Р.Р., Рольф Ф.Дж. (1981). Биометрия: принципы и практика статистики в биологических исследованиях. Оксфорд: W.H. Фриман, ISBN 0-7167-1254-7.