Левенес тест - Levenes test - Wikipedia

В статистика, Тест Левена выводимая статистика, используемая для оценки равенства отклонения для переменной, рассчитанной для двух или более групп.^[1] Некоторые общие статистические процедуры предполагают, что дисперсия совокупностей, из которых взяты разные выборки, равны. Тест Левена оценивает это предположение. Он проверяет нулевая гипотеза что дисперсии населения равны (называемые однородность дисперсии или же гомоскедастичность ). Если в результате п-ценить критерия Левена меньше некоторого уровня значимости (обычно 0,05), полученные различия в дисперсиях выборки вряд ли возникли на основе случайной выборки из генеральной совокупности с равными дисперсиями. Таким образом, нулевая гипотеза о равных дисперсиях отклоняется и делается вывод о различии дисперсий в генеральной совокупности.

Некоторые из процедур, обычно предполагающих гомоскедастичность, для которых можно использовать тесты Левена, включают: дисперсионный анализ и t-тесты.

Перед сравнением средних часто используется проба Левена. Когда тест Левена показывает значимость, следует переключиться на более общие тесты, свободные от предположений о гомоскедастичности (иногда даже непараметрических тестов). Велча т-тест, или же неравные отклонения т-тест более консервативный тест.

Тест Левена также может использоваться в качестве основного теста для ответа на отдельный вопрос о том, имеют ли две подвыборки в данной совокупности одинаковые или разные дисперсии.^[2]

Определение

Тест Левена эквивалентен одностороннему межгрупповому дисперсионному анализу (ANOVA), где зависимой переменной является абсолютное значение разницы между оценкой и средним значением группы, к которой он принадлежит (показано ниже как ${ displaystyle Z_ {ij} = | Y_ {ij} - { bar {Y}} _ {i cdot} |}$ ). Статистика теста, ${ displaystyle W}$ , эквивалентно ${ displaystyle F}$ статистика, которая будет получена с помощью такого ANOVA, и определяется следующим образом:

{ Displaystyle W = { frac {(Nk)} {(k-1)}} cdot { frac { sum _ {i = 1} ^ {k} N_ {i} (Z_ {i cdot} -Z _ { cdot cdot}) ^ {2}} { sum _ {i = 1} ^ {k} sum _ {j = 1} ^ {N_ {i}} (Z_ {ij} -Z_ { i cdot}) ^ {2}}},}

куда

${ displaystyle k}$ - количество различных групп, к которым принадлежат выбранные случаи,
${ displaystyle N_ {i}}$ количество дел в ${ displaystyle i}$ ая группа,
${ displaystyle N}$ общее количество случаев во всех группах,
${ displaystyle Y_ {ij}}$ - значение измеряемой переменной для ${ displaystyle j}$ й случай из ${ displaystyle i}$ ая группа,
${ displaystyle Z_ {ij} = { begin {cases} | Y_ {ij} - { bar {Y}} _ {i cdot} |, & { bar {Y}} _ {i cdot} { text {является средним для}} i { text {-ой группы}}, | Y_ {ij} - { tilde {Y}} _ {i cdot} |, & { tilde {Y }} _ {i cdot} { text {- это медиана}} i { text {-ой группы}}. end {cases}}}$

(Используются оба определения, хотя второе, строго говоря, Тест Брауна – Форсайта - см. Ниже для сравнения.)

${ displaystyle Z_ {i cdot} = { frac {1} {N_ {i}}} sum _ {j = 1} ^ {N_ {i}} Z_ {ij}}$ это среднее значение ${ displaystyle Z_ {ij}}$ для группы ${ displaystyle i}$ ,
${ displaystyle Z _ { cdot cdot} = { frac {1} {N}} sum _ {i = 1} ^ {k} sum _ {j = 1} ^ {N_ {i}} Z_ { ij}}$ это среднее из всех ${ displaystyle Z_ {ij}}$ .

Статистика теста ${ displaystyle W}$ примерно F-распределенный с ${ displaystyle k-1}$ и ${ displaystyle N-k}$ степеней свободы, и, следовательно, значение результата ${ displaystyle w}$ из ${ displaystyle W}$ протестирован против ${ Displaystyle F ( альфа, k-1, N-k)}$ куда ${ displaystyle F}$ - квантиль F-распределения, где ${ displaystyle k-1}$ и ${ displaystyle N-k}$ степени свободы и ${ displaystyle alpha}$ - выбранный уровень значимости (обычно 0,05 или 0,01).

Сравнение с тестом Брауна – Форсайта.

В Тест Брауна – Форсайта использует медианное значение вместо среднего при вычислении разброса внутри каждой группы ( ${ displaystyle { bar {Y}}}$ против. ${ displaystyle { tilde {Y}}}$ , над). Хотя оптимальный выбор зависит от основного распределения, рекомендуется определение, основанное на медиане, как выбор, обеспечивающий хорошее надежность против многих типов ненормальных данных, сохраняя при этом хорошие статистическая мощность.^[2] Если кто-то знает об основном распределении данных, это может указывать на использование одного из других вариантов. Браун и Форсайт исполнили Монте-Карло исследования, которые показали, что использование усеченное среднее работает лучше всего, когда базовые данные следуют Распределение Коши (а хвостатый распределение), а медиана была лучше всего, когда базовые данные следовали за распределение хи-квадрат с четырьмя степенями свободы (сильно асимметричное распределение ). Использование среднего дает наилучшую мощность для симметричных распределений с умеренными хвостами.

Смотрите также

внешняя ссылка

[Levene1960-1] Левен, Ховард (1960). «Робастные тесты на равенство дисперсий». В Инграм Олкин; Гарольд Хотеллинг; и другие. (ред.). Вклад в вероятность и статистику: очерки в честь Гарольда Хотеллинга. Stanford University Press. С. 278–292.

[patvar-2] а ^б Деррик, B; Рак, А; Toher, D; Белый, П (2018). «Тесты на равенство дисперсий между двумя выборками, которые содержат как парные, так и независимые наблюдения» (PDF). Журнал прикладных количественных методов. 13 (2): 36–47.

[1]

[2]

Левенес тест - Levenes test - Wikipedia

Содержание

Определение

Сравнение с тестом Брауна – Форсайта.

Смотрите также

Рекомендации

внешняя ссылка