Левенес тест - Levenes test - Wikipedia

В статистика, Тест Левена выводимая статистика, используемая для оценки равенства отклонения для переменной, рассчитанной для двух или более групп.[1] Некоторые общие статистические процедуры предполагают, что дисперсия совокупностей, из которых взяты разные выборки, равны. Тест Левена оценивает это предположение. Он проверяет нулевая гипотеза что дисперсии населения равны (называемые однородность дисперсии или же гомоскедастичность ). Если в результате п-ценить критерия Левена меньше некоторого уровня значимости (обычно 0,05), полученные различия в дисперсиях выборки вряд ли возникли на основе случайной выборки из генеральной совокупности с равными дисперсиями. Таким образом, нулевая гипотеза о равных дисперсиях отклоняется и делается вывод о различии дисперсий в генеральной совокупности.

Некоторые из процедур, обычно предполагающих гомоскедастичность, для которых можно использовать тесты Левена, включают: дисперсионный анализ и t-тесты.

Перед сравнением средних часто используется проба Левена. Когда тест Левена показывает значимость, следует переключиться на более общие тесты, свободные от предположений о гомоскедастичности (иногда даже непараметрических тестов). Велча т-тест, или же неравные отклонения т-тест более консервативный тест.

Тест Левена также может использоваться в качестве основного теста для ответа на отдельный вопрос о том, имеют ли две подвыборки в данной совокупности одинаковые или разные дисперсии.[2]

Определение

Тест Левена эквивалентен одностороннему межгрупповому дисперсионному анализу (ANOVA), где зависимой переменной является абсолютное значение разницы между оценкой и средним значением группы, к которой он принадлежит (показано ниже как ). Статистика теста, , эквивалентно статистика, которая будет получена с помощью такого ANOVA, и определяется следующим образом:

куда

  • - количество различных групп, к которым принадлежат выбранные случаи,
  • количество дел в ая группа,
  • общее количество случаев во всех группах,
  • - значение измеряемой переменной дляй случай из ая группа,

(Используются оба определения, хотя второе, строго говоря, Тест Брауна – Форсайта - см. Ниже для сравнения.)

  • это среднее значение для группы ,
  • это среднее из всех .

Статистика теста примерно F-распределенный с и степеней свободы, и, следовательно, значение результата из протестирован против куда - квантиль F-распределения, где и степени свободы и - выбранный уровень значимости (обычно 0,05 или 0,01).

Сравнение с тестом Брауна – Форсайта.

В Тест Брауна – Форсайта использует медианное значение вместо среднего при вычислении разброса внутри каждой группы ( против. , над). Хотя оптимальный выбор зависит от основного распределения, рекомендуется определение, основанное на медиане, как выбор, обеспечивающий хорошее надежность против многих типов ненормальных данных, сохраняя при этом хорошие статистическая мощность.[2] Если кто-то знает об основном распределении данных, это может указывать на использование одного из других вариантов. Браун и Форсайт исполнили Монте-Карло исследования, которые показали, что использование усеченное среднее работает лучше всего, когда базовые данные следуют Распределение Кошихвостатый распределение), а медиана была лучше всего, когда базовые данные следовали за распределение хи-квадрат с четырьмя степенями свободы (сильно асимметричное распределение ). Использование среднего дает наилучшую мощность для симметричных распределений с умеренными хвостами.

Смотрите также

Рекомендации

  1. ^ Левен, Ховард (1960). «Робастные тесты на равенство дисперсий». В Инграм Олкин; Гарольд Хотеллинг; и другие. (ред.). Вклад в вероятность и статистику: очерки в честь Гарольда Хотеллинга. Stanford University Press. С. 278–292.
  2. ^ а б Деррик, B; Рак, А; Toher, D; Белый, П (2018). «Тесты на равенство дисперсий между двумя выборками, которые содержат как парные, так и независимые наблюдения» (PDF). Журнал прикладных количественных методов. 13 (2): 36–47.

внешняя ссылка