Преобразование фишера - Fisher transformation

График трансформации (оранжевый). Коэффициент корреляции нетрансформированной выборки отложен по горизонтальной оси, а преобразованный коэффициент отложен по вертикальной оси. Функция идентичности (серый цвет) также показана для сравнения.

В статистика, то Преобразование фишера (он же Фишер z-трансформация) может использоваться для проверки гипотез о ценности совокупности коэффициент корреляции ρ между переменными Икс и Y.[1][2] Это потому, что когда преобразование применяется к коэффициент корреляции выборки, выборочное распределение результирующей переменной приблизительно нормальное, с дисперсией, которая стабильна для различных значений базовой истинной корреляции.

Определение

Учитывая набор N двумерные пары выборок (ИксяYя), я = 1, ..., N, то коэффициент корреляции выборки р дан кем-то

Здесь стоит за ковариация между переменными и и стоит за стандартное отклонение соответствующей переменной. Z-преобразование Фишера р определяется как

где "ln" - натуральный логарифм функция, а arctanh - это функция обратного гиперболического тангенса.

Если (ИксY) имеет двумерное нормальное распределение с корреляцией ρ и парами (ИксяYя) находятся независимые и одинаково распределенные, тогда z примерно нормально распределенный со средним

и стандартная ошибка

куда N - размер выборки, а ρ - истинный коэффициент корреляции.

Это преобразование и обратное ему

можно использовать для построения большой выборки доверительный интервал зар используя стандартную нормальную теорию и выводы. См. Также приложение к частичная корреляция.

Вывод

Преобразование Фишера с и . Проиллюстрирована точная функция плотности вероятности (черным цветом), вместе с функциями плотности вероятности обычного преобразования Фишера (синий) и полученными путем включения дополнительных членов, которые зависят от (красный). Последнее приближение визуально неотличимо от точного ответа (его максимальная ошибка составляет 0,3% по сравнению с 3,4% от базового метода Фишера).

Чтобы получить преобразование Фишера, нужно начать с рассмотрения произвольной возрастающей функции от , сказать . Нахождение первого члена в большой - разложение соответствующей асимметрии приводит к

Приравнивая его к нулю и решая соответствующее дифференциальное уравнение для дает функция. Аналогичным образом расширяя среднее значение и дисперсию , получается

и

соответственно. Дополнительные члены не являются частью обычного преобразования Фишера. Для больших значений и небольшие значения они представляют собой значительное повышение точности при минимальных затратах, хотя они значительно усложняют вычисление обратной величины как выражение в закрытой форме не доступен. Почти постоянная дисперсия преобразования является результатом устранения его асимметрии - фактическое улучшение достигается последним, а не дополнительными членами. С учетом дополнительных условий дает:

который в отличном приближении имеет стандартное нормальное распределение.[3]

Обсуждение

Преобразование Фишера является приближенным преобразование, стабилизирующее дисперсию за р когда Икс и Y следовать двумерному нормальному распределению. Это означает, что дисперсия z приблизительно постоянна для всех значений коэффициента корреляции населения ρ. Без преобразования Фишера дисперсия р становится меньше по мере |ρ| приближается к 1. Поскольку преобразование Фишера приближенно является функцией тождества при |р| <1/2, иногда полезно помнить, что дисперсия р хорошо аппроксимируется 1 /N пока |ρ| не слишком большой и N не так уж и мала. Это связано с тем, что асимптотическая дисперсия р равно 1 для двумерных нормальных данных.

Поведение этого преобразования широко изучалось с тех пор, как Фишер представил его в 1915 году. Сам Фишер нашел точное распределение z для данных двумерного нормального распределения в 1921 г .; Гайен в 1951 году[4]определил точное распределение z для данных из двумерного типа A Распределение Эджворта. Hotelling в 1953 г. вычислил выражения ряда Тейлора для моментов z и несколько связанных статистических данных[5] и Хокинс в 1989 г. открыли асимптотическое распределение z для данных из распределения с ограниченными четвертыми моментами.[6]

Другое использование

Хотя преобразование Фишера в основном связано с Коэффициент корреляции продукт-момент Пирсона для двумерных нормальных наблюдений это также может быть применено к Коэффициент ранговой корреляции Спирмена в более общих случаях.[7] Аналогичный результат для асимптотическое распределение применяется, но с небольшим поправочным коэффициентом: см. последнюю статью[требуется разъяснение ] для подробностей.

Смотрите также

Рекомендации

  1. ^ Фишер, Р. А. (1915). «Частотное распределение значений коэффициента корреляции в выборках неопределенно большой совокупности». Биометрика. 10 (4): 507–521. Дои:10.2307/2331838. HDL:2440/15166. JSTOR  2331838.
  2. ^ Фишер, Р.А. (1921). «О« вероятной ошибке »коэффициента корреляции, полученного на небольшой выборке» (PDF). Метрон. 1: 3–32.
  3. ^ Врбик, янв (декабрь 2005 г.). «Моменты популяции выборочных распределений». Вычислительная статистика. 20 (4): 611–621. Дои:10.1007 / BF02741318.
  4. ^ Гайен, А. К. (1951). «Частотное распределение коэффициента корреляции продукта и момента в случайных выборках любого размера, взятых из ненормальных вселенных». Биометрика. 38 (1/2): 219–247. Дои:10.1093 / biomet / 38.1-2.219. JSTOR  2332329.
  5. ^ Хотеллинг, H (1953). «Новый взгляд на коэффициент корреляции и его преобразования». Журнал Королевского статистического общества, серия B. 15 (2): 193–225. JSTOR  2983768.
  6. ^ Хокинс, Д. Л. (1989). «Использование U-статистики для получения асимптотического распределения Z-статистики Фишера». Американский статистик. 43 (4): 235–237. Дои:10.2307/2685369. JSTOR  2685369.
  7. ^ Зар, Джерролд Х. (2005). «Корреляция рангов Спирмена: Обзор». Энциклопедия биостатистики. Дои:10.1002 / 9781118445112.stat05964. ISBN  9781118445112.