Пример доказательства Штейна - Proof of Steins example - Wikipedia

Пример Штейна важный результат в теория принятия решений что можно сформулировать как

Обычное решающее правило для оценки среднего многомерного распределения Гаусса недопустимо при среднеквадратическом риске ошибки в размерности не менее 3.

Ниже приводится схема его доказательства.^[1] Читателя отсылаем к основная статья для дополнительной информации.

Набросал доказательство

В функция риска правила принятия решения ${ Displaystyle д ( mathbf {x}) = mathbf {x}}$ является

{ Displaystyle R ( theta, d) = operatorname {E} _ { theta} [| mathbf { theta -X} | ^ {2}]}

{ displaystyle = int ( mathbf { theta -x}) ^ {T} ( mathbf { theta -x}) left ({ frac {1} {2 pi}} right) ^ { n / 2} e ^ {(- 1/2) ( mathbf { theta -x}) ^ {T} ( mathbf { theta -x})} m (dx)}

{ Displaystyle = п.}

Теперь рассмотрим правило принятия решения

{ displaystyle d '( mathbf {x}) = mathbf {x} - { frac { alpha} {| mathbf {x} | ^ {2}}} mathbf {x}}

куда ${ Displaystyle альфа = п-2}$ . Мы покажем, что ${ displaystyle d '}$ это лучшее решение, чем ${ displaystyle d}$ . Функция риска

{ Displaystyle R ( theta, d ') = operatorname {E} _ { theta} left [ left | mathbf { theta -X} + { frac { alpha} {| mathbf {X } | ^ {2}}} mathbf {X} right | ^ {2} right]}

{ displaystyle = operatorname {E} _ { theta} left [| mathbf { theta -X} | ^ {2} +2 ( mathbf { theta -X}) ^ {T} { frac { alpha} {| mathbf {X} | ^ {2}}} mathbf {X} + { frac { alpha ^ {2}} {| mathbf {X} | ^ {4}}} | mathbf {X} | ^ {2} right]}

{ displaystyle = operatorname {E} _ { theta} left [| mathbf { theta -X} | ^ {2} right] +2 alpha operatorname {E} _ { theta} left [{ frac { mathbf {( theta -X) ^ {T} X}} {| mathbf {X} | ^ {2}}} right] + alpha ^ {2} operatorname {E} _ { theta} left [{ frac {1} {| mathbf {X} | ^ {2}}} right]}

- квадратичный по ${ displaystyle alpha}$ . Мы можем упростить средний термин, рассмотрев общую функцию "хорошего поведения" ${ displaystyle h: mathbf {x} mapsto h ( mathbf {x}) in mathbb {R}}$ и используя интеграция по частям. За ${ Displaystyle 1 Leq я Leq п}$ , для любого непрерывно дифференцируемого ${ displaystyle h}$ растет достаточно медленно для больших ${ displaystyle x_ {i}}$ у нас есть: