В статистика, Беспристрастная оценка риска Штейна (SURE) является беспристрастный оценщик из среднеквадратичная ошибка «почти произвольной, нелинейной смещенной оценки».[1] Другими словами, он обеспечивает указание точности данной оценки. Это важно, поскольку истинная среднеквадратическая ошибка оценщика является функцией неизвестного параметра, подлежащего оценке, и поэтому не может быть определена точно.
Методика названа в честь первооткрывателя, Чарльз Штайн.[2]
Официальное заявление
Позволять
- неизвестный параметр, и пусть
вектор измерения, компоненты которого независимы и нормально распределены со средним
и дисперсия
. Предполагать
является оценкой
из
, и может быть написано
, куда
является слабо дифференцируемый. Тогда объективная оценка риска Штейна дается выражением[3]
![{ displaystyle operatorname {SURE} (h) = d sigma ^ {2} + | g (x) | ^ {2} +2 sigma ^ {2} sum _ {i = 1} ^ { d} { frac { partial} { partial x_ {i}}} g_ {i} (x) = - d sigma ^ {2} + | g (x) | ^ {2} +2 сигма ^ {2} sum _ {i = 1} ^ {d} { frac { partial} { partial x_ {i}}} h_ {i} (x),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/61a25d05f1602c60c7996e7bf67baebef12bcf78)
куда
это
й компонент функции
, и
это Евклидова норма.
Важность SURE состоит в том, что это объективная оценка среднеквадратичной ошибки (или квадрата риска ошибки)
, т.е.
![{ displaystyle operatorname {E} _ { mu} { operatorname {SURE} (h) } = operatorname {MSE} (h), , !}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5e62137968771ec1bc1db34f5da524d55bff44e0)
с
![{ displaystyle operatorname {MSE} (h) = operatorname {E} _ { mu} | h (x) - mu | ^ {2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6abf52e4d7d0ae05dbcd301f3c20990af2a93868)
Таким образом, минимизация SURE может действовать как суррогат для минимизации MSE. Обратите внимание, что нет зависимости от неизвестного параметра.
в выражении для УВЕРЕН. Таким образом, им можно манипулировать (например, для определения оптимальных настроек оценки) без знания
.
Доказательство
Мы хотим показать, что
![{ displaystyle operatorname {E} _ { mu} | h (x) - mu | ^ {2} = operatorname {E} _ { mu} { operatorname {SURE} (h) }.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fdc508861f2afce946d2b0e5b4c4dd54531565a6)
Начнем с расширения MSE как
![{ displaystyle { begin {align} operatorname {E} _ { mu} | h (x) - mu | ^ {2} & = operatorname {E} _ { mu} | g ( x) + x- mu | ^ {2} & = operatorname {E} _ { mu} | g (x) | ^ {2} + operatorname {E} _ { mu} | x- mu | ^ {2} +2 operatorname {E} _ { mu} g (x) ^ {T} (x- mu) & = operatorname {E} _ { mu} | g (x) | ^ {2} + d sigma ^ {2} +2 operatorname {E} _ { mu} g (x) ^ {T} (x- mu). конец {выровнен}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/46ce885b351e34ec30c229a2eebba14661f57c10)
Теперь мы используем интеграция по частям переписать последний член:
![{ displaystyle { begin {align} operatorname {E} _ { mu} g (x) ^ {T} (x- mu) & = int _ {{ mathbb {R}} ^ {d} } { frac {1} { sqrt {2 pi sigma ^ {2d}}}} exp left (- { frac { | x- mu | ^ {2}} {2 sigma ^ {2}}} right) sum _ {i = 1} ^ {d} g_ {i} (x) (x_ {i} - mu _ {i}) d ^ {d} x & = sigma ^ {2} sum _ {i = 1} ^ {d} int _ {{ mathbb {R}} ^ {d}} { frac {1} { sqrt {2 pi sigma ^ {2d}}}} exp left (- { frac { | x- mu | ^ {2}} {2 sigma ^ {2}}} right) { frac {dg_ {i }} {dx_ {i}}} d ^ {d} x & = sigma ^ {2} sum _ {i = 1} ^ {d} operatorname {E} _ { mu} { frac {dg_ {i}} {dx_ {i}}}. end {align}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5f23a26e19a1b8c0521514ecabcdfdf416525a41)
Подставляя это в выражение для MSE, мы приходим к
![{ displaystyle operatorname {E} _ { mu} | h (x) - mu | ^ {2} = operatorname {E} _ { mu} left (d sigma ^ {2} + | g (x) | ^ {2} +2 sigma ^ {2} sum _ {i = 1} ^ {d} { frac {dg_ {i}} {dx_ {i}}} right ).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/413c592f2fb423679529472f33cda11a0ef4bf70)
Приложения
Стандартное применение SURE - выбрать параметрическую форму для оценщика, а затем оптимизировать значения параметров, чтобы минимизировать оценку риска. Этот метод применялся в нескольких ситуациях. Например, вариант Оценка Джеймса – Стейна можно получить, найдя оптимальное оценщик усадки.[2] Техника также использовалась Донохо и Джонстона для определения оптимального коэффициента усадки в вейвлет шумоподавление параметр.[1]
Рекомендации