Беспристрастная оценка стандартного отклонения - Unbiased estimation of standard deviation

В статистика и в частности статистическая теория, объективная оценка стандартного отклонения это расчет из статистическая выборка оценочной стоимости стандартное отклонение (мера статистическая дисперсия ) из численность населения ценностей таким образом, чтобы ожидаемое значение расчета равняется истинному значению. За исключением некоторых важных ситуаций, описанных ниже, эта задача имеет мало отношения к приложениям статистики, поскольку ее необходимость устраняется стандартными процедурами, такими как использование тесты значимости и доверительные интервалы, или используя Байесовский анализ.

Однако для статистической теории она представляет собой пример проблемы в контексте теория оценки которое и просто сформулировать, и по которому результаты не могут быть получены в закрытой форме. В нем также приводится пример, когда требуется объективная оценка может рассматриваться как добавление неудобств без реальной пользы.

Фон

В статистика, то стандартное отклонение численности популяции часто оценивается по случайный пример взяты из населения. Это стандартное отклонение выборки, которое определяется как

{displaystyle s = {sqrt {frac {sum _ {i = 1} ^ {n} (x_ {i} - {overline {x}}) ^ {2}} {n-1}}},}

куда ${displaystyle {x_ {1}, x_ {2}, ldots, x_ {n}}}$ - образец (формально реализации из случайная переменная Икс) и ${displaystyle {overline {x}}}$ это выборочное среднее.

Один из способов увидеть, что это предвзятый оценщик стандартного отклонения совокупности следует исходить из результата, что s² является объективный оценщик для отклонение σ² основной генеральной совокупности, если такое отклонение существует и значения выборки строятся независимо с заменой. Квадратный корень - это нелинейная функция, и только линейные функции коммутируют с математическим ожиданием. Поскольку квадратный корень - строго вогнутая функция, из Неравенство Дженсена что квадратный корень из дисперсии выборки занижен.

Использование п - 1 вместо п в формуле для выборочной дисперсии называется Поправка Бесселя, что исправляет систематическую ошибку в оценке совокупности дисперсия и некоторые, но не все смещения в оценке населения стандартное отклонение.

Невозможно найти оценку стандартного отклонения, которая была бы несмещенной для всех распределений населения, поскольку смещение зависит от конкретного распределения. Большая часть следующего относится к оценке, предполагающей нормальное распределение.

Коррекция смещения

Результаты для нормального распределения

Поправочный коэффициент

{displaystyle c_ {4}}

по сравнению с размером выборки п.

Когда случайная величина нормально распределенный, существует небольшая поправка для устранения смещения. Чтобы получить поправку, обратите внимание, что для нормально распределенных Икс, Теорема Кохрана подразумевает, что ${displaystyle (n-1) s ^ {2} / sigma ^ {2}}$ имеет распределение хи-квадрат с ${displaystyle n-1}$ степени свободы и, следовательно, его квадратный корень, ${displaystyle {sqrt {n-1}} s / sigma}$ имеет распределение ци с ${displaystyle n-1}$ степени свободы. Следовательно, вычисляя математическое ожидание этого последнего выражения и переставляя константы,

{displaystyle operatorname {E} [s] = c_ {4} (n) sigma}

где поправочный коэффициент ${displaystyle c_ {4} (n)}$ является средним масштабом распределения хи с ${displaystyle n-1}$ степени свободы, ${displaystyle mu _ {1} / {sqrt {n-1}}}$ . Это зависит от размера выборки п, и дается следующим образом:^[1]

{displaystyle c_ {4} (n) = {sqrt {frac {2} {n-1}}} {frac {Gamma left ({frac {n} {2}} ight)} {Gamma left ({frac {n -1} {2}} ight)}} = 1- {frac {1} {4n}} - {frac {7} {32n ^ {2}}} - {frac {19} {128n ^ {3}} } + O (п ^ {- 4})}

где Γ (·) - гамма-функция. Беспристрастная оценка σ можно получить, разделив ${displaystyle s}$ к ${displaystyle c_ {4} (n)}$ . В качестве ${displaystyle n}$ увеличивается, приближаясь к 1, и даже для меньших значений поправка незначительна. На рисунке показан график ${displaystyle c_ {4} (n)}$ по сравнению с размером выборки. В таблице ниже приведены числовые значения ${displaystyle c_ {4} (n)}$ и алгебраические выражения для некоторых значений ${displaystyle n}$ ; более полные таблицы можно найти в большинстве учебников^{[нужна цитата ]} на статистический контроль качества.

Размер образца	Выражение ${displaystyle c_ {4}}$	Численная величина
2	${displaystyle {sqrt {frac {2} {pi}}}}$	0.7978845608
3	${displaystyle {frac {sqrt {pi}} {2}}}$	0.8862269255
4	${displaystyle 2 {sqrt {frac {2} {3pi}}}}$	0.9213177319
5	${displaystyle {frac {3} {4}} {sqrt {frac {pi} {2}}}}$	0.9399856030
6	${displaystyle {frac {8} {3}} {sqrt {frac {2} {5pi}}}}$	0.9515328619
7	${displaystyle {frac {5 {sqrt {3pi}}} {16}}}$	0.9593687891
8	${displaystyle {frac {16} {5}} {sqrt {frac {2} {7pi}}}}$	0.9650304561
9	${displaystyle {frac {35 {sqrt {pi}}} {64}}}$	0.9693106998
10	${displaystyle {frac {128} {105}} {sqrt {frac {2} {pi}}}}$	0.9726592741
100		0.9974779761
1000		0.9997497811
10000		0.9999749978
2k	${displaystyle {sqrt {frac {2} {pi (2k-1)}}} {frac {2 ^ {2k-2} (k-1)! ^ {2}} {(2k-2)!}}}$
2к + 1	${displaystyle {sqrt {frac {pi} {k}}} {frac {(2k-1)!} {2 ^ {2k-1} (k-1)! ^ {2}}}}$

Важно помнить, что эта поправка дает несмещенную оценку только для нормально и независимо распределенных Икс. Когда это условие выполнено, другой результат о s с участием ${displaystyle c_ {4} (n)}$ это то стандартная ошибка из s является^[2]^[3] ${displaystyle sigma {sqrt {1-c_ {4} ^ {2}}}}$ , в то время как стандартная ошибка несмещенной оценки ${displaystyle sigma {sqrt {c_ {4} ^ {- 2} -1}}.}$

Практическое правило нормального распределения

Если расчет функции c₄(п) кажется слишком сложным, есть простое практическое правило^[4] взять оценщик

{displaystyle {hat {sigma}} = {sqrt {{frac {1} {n-1.5}} sum _ {i = 1} ^ {n} (x_ {i} - {overline {x}}) ^ {2 }}}}

Формула отличается от привычного выражения для s² только имея п − 1.5 вместо п − 1 в знаменателе. Это выражение является приблизительным; по факту,

{displaystyle operatorname {E} left [{hat {sigma}} ight] = sigma cdot left (1+ {frac {1} {16n ^ {2}}} + {frac {3} {16n ^ {3}}}) + O (n ^ {- 4}) ight).}

Смещение относительно невелико: скажем, для ${displaystyle n = 3}$ он равен 1,3%, а для ${displaystyle n = 9}$ смещение уже 0,1%.

Другие дистрибутивы

В случаях, когда статистически независимый данные моделируются параметрическим семейством распределений, отличным от нормальное распределение, стандартное отклонение генеральной совокупности, если оно существует, будет функцией параметров модели. Один общий подход к оценке был бы максимальная вероятность. В качестве альтернативы можно использовать Теорема Рао – Блэквелла как путь к точной оценке стандартного отклонения. Ни в том, ни в другом случае полученные оценки обычно не были бы объективными. Теоретически можно получить теоретические поправки, которые приведут к несмещенным оценкам, но, в отличие от поправок для нормального распределения, они обычно будут зависеть от предполагаемых параметров.

Если требуется просто уменьшить систематическую ошибку оценочного стандартного отклонения, а не полностью устранить ее, тогда доступны два практических подхода, оба в контексте повторная выборка. Это складной нож и самонастройка. Оба могут применяться либо к параметрическим оценкам стандартного отклонения, либо к стандартному отклонению выборки.

Для ненормальных распределений приблизительное (до О(п⁻¹) условия) формула для несмещенной оценки стандартного отклонения имеет вид

{displaystyle {hat {sigma}} = {sqrt {{frac {1} {n-1.5- {frac {1} {4}} gamma _ {2}}} sum _ {i = 1} ^ {n} left (x_ {i} - {overline {x}} ight) ^ {2}}},}

куда γ₂ обозначает население избыточный эксцесс. Избыточный эксцесс для определенных распределений может быть известен заранее или рассчитан на основе данных.

Эффект автокорреляции (серийная корреляция)

Приведенный выше материал, чтобы еще раз подчеркнуть, относится только к независимым данным. Однако реальные данные часто не соответствуют этому требованию; это автокоррелированный (также известная как серийная корреляция). В качестве одного примера, последовательные показания измерительного прибора, который включает в себя некоторую форму процесса «сглаживания» (вернее, низкочастотной фильтрации), будут автокоррелированы, поскольку любое конкретное значение вычисляется из некоторой комбинации более ранних и более поздних показаний.

Оценки дисперсии и стандартного отклонения автокоррелированных данных будут смещены. Ожидаемое значение дисперсии выборки равно^[5]

{displaystyle {m {E}} left [s ^ {2} ight] = sigma ^ {2} left [1- {frac {2} {n-1}} сумма _ {k = 1} ^ {n-1 } left (1- {frac {k} {n}} ight) ho _ {k} ight]}

куда п - размер выборки (количество измерений) и ${displaystyle ho _ {k}}$ автокорреляционная функция (АКФ) данных. (Обратите внимание, что выражение в скобках - это просто единица минус средняя ожидаемая автокорреляция для показаний.) Если ACF состоит из положительных значений, тогда оценка дисперсии (и ее квадратного корня, стандартного отклонения) будет иметь низкое смещение. То есть фактическая изменчивость данных будет больше, чем указанная в результате расчета нескорректированной дисперсии или стандартного отклонения. Важно понимать, что, если это выражение будет использоваться для корректировки систематической ошибки, разделив оценку ${displaystyle s ^ {2}}$ на количество в скобках выше, тогда должен быть известен ACF аналитически, а не путем оценки на основе данных. Это связано с тем, что оценочная ACF сама будет смещена.^[6]

Пример смещения стандартного отклонения

Чтобы проиллюстрировать величину систематической ошибки в стандартном отклонении, рассмотрим набор данных, который состоит из последовательных показаний прибора, использующего определенный цифровой фильтр, ACF которого, как известно, определяется выражением

{displaystyle ho _ {k} = (1-альфа) ^ {k}}

куда α - параметр фильтра, принимает значения от нуля до единицы. Таким образом, ACF положительна и геометрически убывает.

Смещение стандартного отклонения для автокоррелированных данных.

На рисунке показано отношение расчетного стандартного отклонения к его известному значению (которое может быть вычислено аналитически для этого цифрового фильтра) для нескольких настроек α как функция размера выборки п. Изменение α изменяет коэффициент уменьшения дисперсии фильтра, который, как известно,

{displaystyle {m {VRR}} = {frac {alpha} {2-alpha}}}

так что меньшие значения α приведет к большему сокращению дисперсии или «сглаживанию». Смещение указано значениями на вертикальной оси, отличными от единицы; то есть, если бы не было смещения, отношение расчетного стандартного отклонения к известному было бы равно единице. Очевидно, что для небольших размеров выборки может быть значительная систематическая ошибка (в два или более раз).

Дисперсия среднего

Часто представляет интерес оценить дисперсию или стандартное отклонение оценочного иметь в виду а не дисперсия населения. Когда данные автокоррелированы, это оказывает прямое влияние на теоретическую дисперсию выборочного среднего, которая равна^[7]

{displaystyle {m {Var}} left [{overline {x}} ight] = {frac {sigma ^ {2}} {n}} left [1 + 2sum _ {k = 1} ^ {n-1} { left (1- {frac {k} {n}} ight) ho _ {k}} ight].}

Затем можно оценить дисперсию выборочного среднего, подставив оценку σ². Одна такая оценка может быть получена из уравнения для E [s²] данные выше. Сначала определите следующие константы, снова предполагая, что известен АКФ:

{displaystyle gamma _ {1} Equiv 1- {frac {2} {n-1}} sum _ {k = 1} ^ {n-1} {left (1- {frac {k} {n}} ight) } хо _ {к}}

{displaystyle gamma _ {2} Equiv 1 + 2sum _ {k = 1} ^ {n-1} {left (1- {frac {k} {n}} ight)} ho _ {k}}

так что

{displaystyle {m {E}} left [s ^ {2} ight] = sigma ^ {2} gamma _ {1} Rightarrow {m {E}} left [{frac {s ^ {2}} {gamma _ { 1}}} ight] = сигма ^ {2}}

Это говорит о том, что ожидаемое значение величины, полученной путем деления наблюдаемой дисперсии выборки на поправочный коэффициент ${displaystyle gamma _ {1}}$ дает объективную оценку дисперсии. Точно так же переписав приведенное выше выражение для дисперсии среднего,

{displaystyle {m {Var}} left [{overline {x}} ight] = {frac {sigma ^ {2}} {n}} gamma _ {2}}

и подставив оценку для ${displaystyle sigma ^ {2}}$ дает^[8]

{displaystyle {m {Var}} left [{overline {x}} ight] = {m {E}} left [{frac {s ^ {2}} {gamma _ {1}}} left ({frac {gamma _ {2}} {n}} ight) ight] = {m {E}} влево [{frac {s ^ {2}} {n}} left {{frac {n-1} {{frac {n}] {gamma _ {2}}} - 1}} ight} ight]}

который представляет собой несмещенную оценку дисперсии среднего с точки зрения наблюдаемой дисперсии выборки и известных величин. Обратите внимание, что если автокорреляции ${displaystyle ho _ {k}}$ тождественно равны нулю, это выражение сводится к хорошо известному результату для дисперсии среднего для независимых данных. Эффект оператора математического ожидания в этих выражениях заключается в том, что равенство выполняется в среднем (т.е. в среднем).

Оценка стандартного отклонения совокупности

Имея приведенные выше выражения с участием отклонение из совокупности и оценки среднего для этой совокупности, было бы логично просто извлечь квадратный корень из этих выражений, чтобы получить несмещенные оценки соответствующих стандартных отклонений. Однако, поскольку ожидания являются интегралами,

{displaystyle {m {E}} [s] eq {sqrt {{m {E}} left [s ^ {2} ight]}} eq sigma {sqrt {gamma _ {1}}}}

Вместо этого возьмем функцию θ существует такой, что несмещенная оценка стандартного отклонения может быть записана

{displaystyle {m {E}} [s] = sigma heta {sqrt {gamma _ {1}}} Rightarrow {hat {sigma}} = {frac {s} {heta {sqrt {gamma _ {1}}}} }}

и θ зависит от размера выборки п и АКФ. В случае данных NID (нормально и независимо распределенных) подкоренное выражение равно единице и θ это просто c₄ функция, указанная в первом разделе выше. Как и с c₄, θ приближается к единице по мере увеличения размера выборки (как и γ₁).

С помощью имитационного моделирования можно продемонстрировать, что игнорирование θ (то есть принимая его за единицу) и используя

{displaystyle {m {E}} [s] приблизительно сигма {sqrt {gamma _ {1}}} Rightarrow {hat {sigma}} приблизительно {frac {s} {sqrt {gamma _ {1}}}}}

устраняет все, кроме нескольких процентов смещения, вызванного автокорреляцией, делая это уменьшенныйоценщик смещения, а не ООНпредвзятый оценщик. В практических ситуациях измерения это уменьшение систематической ошибки может быть значительным и полезным, даже если сохраняется относительно небольшая погрешность. Рисунок выше, показывающий пример смещения стандартного отклонения в зависимости от размера выборки, основан на этом приближении; фактическое смещение будет несколько больше, чем указано на этих графиках, поскольку смещение преобразования θ не входит туда.

Оценка стандартного отклонения выборочного среднего

Несмещенная дисперсия среднего с точки зрения дисперсии генеральной совокупности и ACF определяется выражением

{displaystyle {m {Var}} left [{overline {x}} ight] = {frac {sigma ^ {2}} {n}} gamma _ {2}}

и поскольку здесь нет ожидаемых значений, в этом случае можно извлечь квадратный корень, так что

{displaystyle sigma _ {overline {x}} = {frac {sigma} {sqrt {n}}} {sqrt {gamma _ {2}}}}

Используя приведенное выше выражение несмещенной оценки для σ, оценивать стандартного отклонения среднего тогда будет

{displaystyle {hat {sigma}} _ {overline {x}} = {frac {s} {heta {sqrt {n}}}} {frac {sqrt {gamma _ {2}}} {sqrt {gamma _ {1} }}}}}

Если данные являются NID, так что ACF исчезает, это сводится к

{displaystyle {hat {sigma}} _ {overline {x}} = {frac {s} {c_ {4} {sqrt {n}}}}}

При наличии ненулевой АКФ игнорирование функции θ как и раньше приводит к уменьшенныйоценщик смещения

{displaystyle {hat {sigma}} _ {overline {x}} примерно {frac {s} {sqrt {n}}} {frac {sqrt {gamma _ {2}}} {sqrt {gamma _ {1}}} } = {frac {s} {sqrt {n}}} {sqrt {frac {n-1} {{frac {n} {gamma _ {2}}} - 1}}}}

что снова можно продемонстрировать, чтобы устранить полезное большинство систематической ошибки.

Смотрите также

внешняя ссылка

А Интерактивная графика Java показывает PDF-файл Хельмерта, из которого выводятся поправочные коэффициенты смещения.
Демонстрация моделирования Монте-Карло для объективной оценки стандартного отклонения.
http://www.itl.nist.gov/div898/handbook/pmc/section3/pmc32.htm Что такое контрольные диаграммы переменных?

Эта статья включаетматериалы общественного достояния от Национальный институт стандартов и технологий интернет сайт https://www.nist.gov.

[1] Бен В. Болч, "Подробнее о беспристрастной оценке стандартного отклонения", The American Statistician, 22 (3), p. 27 (1968)

[2] Дункан, А. Дж., Контроль качества и промышленная статистика 4-е изд., Ирвин (1974) ISBN 0-256-01558-9, стр.139

[3] * Н.Л. Джонсон, С. Коц и Н. Балакришнан, Непрерывные одномерные распределения, Том 1, 2-е издание, Wiley and sons, 1994. ISBN 0-471-58495-9. Уровень 13 Слово 8.2

[4] Ричард М. Бруггер, "Заметка о беспристрастной оценке стандартного отклонения", Американский статистик (23) 4 стр. 32 (1969)

[5] Ло и Келтон, Имитационное моделирование и анализ, 2-е изд. Макгроу-Хилл (1991), стр.284, ISBN 0-07-036698-5. Это выражение может быть получено из его первоначального источника в Андерсоне, Статистический анализ временных рядов, Wiley (1971), ISBN 0-471-04745-7, стр.448, уравнение 51.

[6] Ло и Келтон, стр.286. Это смещение количественно определено в Anderson, p.448, Equations 52–54.

[7] Ло и Келтон, стр.285. Это уравнение может быть получено из теоремы 8.2.3 Андерсона. Он также появляется в Box, Jenkins, Reinsel, Анализ временных рядов: прогнозирование и контроль, 4-е изд. Wiley (2008), ISBN 978-0-470-27284-8, стр.31.

[8] Ло и Келтон, стр.285

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]