Преобразование, стабилизирующее отклонение - Variance-stabilizing transformation

В прикладной статистика, а преобразование, стабилизирующее дисперсию это преобразование данных который специально выбран либо для упрощения рассмотрения графического исследовательского анализа данных, либо для обеспечения возможности применения простых основанных на регрессии или дисперсионный анализ техники.[1]

Обзор

Цель выбора преобразования, стабилизирующего дисперсию, - найти простую функцию ƒ применять к ценностям Икс в наборе данных для создания новых значений у = ƒ(Икс) так что изменчивость значений у не связано с их средним значением. Например, предположим, что значения x являются реализациями из разных Распределения Пуассона: т.е. каждое распределение имеет разные средние значения μ. Затем, поскольку для распределения Пуассона дисперсия идентична среднему, дисперсия зависит от среднего. Однако если простое преобразование, стабилизирующее дисперсию

применяется, дисперсия выборки, связанная с наблюдением, будет почти постоянной: см. Преобразование Анскомба для деталей и некоторых альтернативных преобразований.

Хотя преобразования, стабилизирующие дисперсию, хорошо известны для некоторых параметрических семейств распределений, таких как пуассоновское и биномиальное распределение некоторые виды анализа данных проводятся более эмпирически: например, путем поиска среди трансформации власти найти подходящее фиксированное преобразование. В качестве альтернативы, если анализ данных предлагает функциональную форму отношения между дисперсией и средним значением, это можно использовать для вывода преобразования, стабилизирующего дисперсию.[2] Таким образом, если для среднего μ,

подходящей основой для преобразования, стабилизирующего дисперсию, будет

где для удобства можно выбрать произвольную постоянную интегрирования и произвольный масштабный коэффициент.

Пример: относительная дисперсия

Если Икс - положительная случайная величина, а дисперсия задается как час(μ) = s2μ2 тогда стандартное отклонение пропорционально среднему значению, которое называется фиксированным. относительная ошибка. В этом случае преобразование, стабилизирующее дисперсию, имеет вид

То есть преобразование, стабилизирующее дисперсию, является логарифмическим преобразованием.

Пример: абсолютная плюс относительная дисперсия

Если дисперсия задана как час(μ) = σ2 + s2μ2 тогда в дисперсии преобладает фиксированная дисперсия σ2 когда |μ| достаточно мала и в ней преобладает относительная дисперсия s2μ2 когда |μ| достаточно большой. В этом случае преобразование, стабилизирующее дисперсию, имеет вид

То есть преобразование, стабилизирующее дисперсию, является обратный гиперболический синус масштабированного значения Икс / λ за λ = σ / s.

Связь с дельта-методом

Здесь дельта-метод представлен в грубой форме, но этого достаточно, чтобы увидеть связь с преобразованиями, стабилизирующими дисперсию. Чтобы увидеть более формальный подход, см. дельта-метод.

Позволять быть случайной величиной, с и .Определять , куда является регулярной функцией. Приближение Тейлора первого порядка для является:

Из приведенного выше уравнения получаем:

и

Этот метод аппроксимации называется дельта-методом.

Рассмотрим теперь случайную величину такой, что и Обратите внимание на связь между дисперсией и средним значением, которая подразумевает, например, гетероскедастичность в линейной модели. Следовательно, цель - найти функцию такой, что имеет дисперсию, не зависящую (по крайней мере приблизительно) от своего ожидания.

Наложение условия , из этого равенства следует дифференциальное уравнение:

Это обыкновенное дифференциальное уравнение при разделении переменных имеет следующее решение:

Это последнее выражение впервые появилось в М. С. Бартлетт бумага.[3]

Рекомендации

  1. ^ Эверитт, Б. С. (2002). Кембриджский статистический словарь (2-е изд.). ЧАШКА. ISBN  0-521-81099-X.
  2. ^ Додж, Ю. (2003). Оксфордский словарь статистических терминов. ОУП. ISBN  0-19-920613-9.
  3. ^ Бартлетт, М. С. (1947). «Использование преобразований». Биометрия. 3: 39–52. Дои:10.2307/3001536.