Допустимое правило принятия решения - Admissible decision rule

В теория статистических решений, допустимое правило принятия решения это правило для принятия решения так что нет другого правила, которое всегда "лучше", чем это^[1] (или, по крайней мере, иногда лучше и никогда не хуже) в точном смысле слова «лучше», определяемом ниже. Эта концепция аналогична Парето эффективность.

Определение

Определять наборы ${ Displaystyle Theta ,}$ , ${ displaystyle { mathcal {X}}}$ и ${ displaystyle { mathcal {A}}}$ , куда ${ Displaystyle Theta ,}$ состояния природы, ${ displaystyle { mathcal {X}}}$ возможные наблюдения и ${ displaystyle { mathcal {A}}}$ действия, которые могут быть предприняты. Наблюдение ${ Displaystyle х в { mathcal {X}} , !}$ распространяется как ${ Displaystyle F (х середина тета) , !}$ и поэтому предоставляет свидетельства о состоянии природы ${ displaystyle theta in Theta , !}$ . А правило принятия решения это функция ${ displaystyle delta: { mathcal {X}} rightarrow { mathcal {A}}}$ , где при наблюдении ${ displaystyle x in { mathcal {X}}}$ , мы решили действовать ${ Displaystyle дельта (х) в { mathcal {A}} , !}$ .

Также определите функция потерь ${ Displaystyle L: Theta times { mathcal {A}} rightarrow mathbb {R}}$ , который указывает убыток, который мы понесем, приняв меры ${ displaystyle a in { mathcal {A}}}$ когда истинное состояние природы ${ displaystyle theta in Theta}$ . Обычно мы предпринимаем это действие после просмотра данных. ${ displaystyle x in { mathcal {X}}}$ , так что убыток будет ${ Displaystyle L ( тета, дельта (х)) , !}$ . (Можно, хотя и нетрадиционно, переформулировать следующие определения в терминах вспомогательная функция, что является отрицательной величиной потерь.)

Определить функция риска как ожидание

{ Displaystyle R ( theta, delta) = operatorname {E} _ {F (x mid theta)} [{L ( theta, delta (x))]}. , !}

Правило ли решения ${ displaystyle delta , !}$ имеет низкий риск зависит от истинного состояния природы ${ Displaystyle тета , !}$ . Правило принятия решения ${ displaystyle delta ^ {*} , !}$ доминирует правило принятия решения ${ displaystyle delta , !}$ если и только если ${ Displaystyle Р ( тета, дельта ^ {*}) Leq R ( тета, дельта)}$ для всех ${ Displaystyle тета , !}$ , и неравенство строгий для некоторых ${ Displaystyle тета , !}$ .

Правило принятия решения допустимый (относительно функции потерь) тогда и только тогда, когда никакое другое правило не доминирует над ней; в противном случае это недопустимый. Таким образом, допустимое правило принятия решения - это максимальный элемент в отношении указанного выше частичного порядка. недопустимое правило не является предпочтительным (за исключением соображений простоты или вычислительной эффективности), поскольку по определению существует какое-то другое правило, которое позволит достичь равного или меньшего риска для все ${ Displaystyle тета , !}$ . Но только потому, что правило ${ displaystyle delta , !}$ допустимо, не означает, что это хорошее правило. Приемлемость означает, что нет другого единственного правила, которое всегда так же хорошо или лучше - но другие допустимые правила могут снизить риск для большинства ${ Displaystyle тета , !}$ что происходит на практике. (Байесовский риск, обсуждаемый ниже, представляет собой способ явно рассмотреть, какие ${ Displaystyle тета , !}$ встречаются на практике.)

Правила Байеса и обобщенные правила Байеса

Правила Байеса

Позволять ${ Displaystyle пи ( тета) , !}$ - распределение вероятностей состояний природы. Из Байесовский точки зрения, мы рассматриваем это как предварительное распространение. То есть это наше предполагаемое распределение вероятностей состояний природы до данных наблюдений. Для частотник, это просто функция на ${ Displaystyle Theta , !}$ без такой специальной интерпретации. В Байесовский риск правила принятия решения ${ displaystyle delta , !}$ относительно ${ Displaystyle пи ( тета) , !}$ это ожидание

{ displaystyle r ( pi, delta) = operatorname {E} _ { pi ( theta)} [R ( theta, delta)]. , !}

Правило принятия решения ${ displaystyle delta , !}$ что сводит к минимуму ${ Displaystyle г ( пи, дельта) , !}$ называется Правило Байеса относительно ${ Displaystyle пи ( тета) , !}$ . Таких правил Байеса может быть несколько. Если байесовский риск бесконечен для всех ${ displaystyle delta , !}$ , то правило Байеса не определено.

Обобщенные правила Байеса

В байесовском подходе к теории принятия решений наблюдаемое ${ Displaystyle х , !}$ Считается фиксированный. В то время как частотный подход (т.е. риск) усредняет возможные выборки ${ Displaystyle х в { mathcal {X}} , !}$ , байесовский фиксирует наблюдаемый образец ${ Displaystyle х , !}$ и среднее значение по гипотезам ${ displaystyle theta in Theta , !}$ . Таким образом, байесовский подход должен учитывать наши наблюдаемые ${ Displaystyle х , !}$ то ожидаемый убыток

{ Displaystyle rho ( пи, дельта середина х) = OperatorName {E} _ { пи ( тета середина х)} [L ( тета, дельта (х))]. , !}

где ожидание превышает задний из ${ Displaystyle theta , !}$ данный ${ Displaystyle х , !}$ (получен из ${ Displaystyle пи ( тета) , !}$ и ${ Displaystyle F (х середина тета) , !}$ с помощью Теорема Байеса ).

Сделав явным ожидаемый убыток для каждого данного ${ Displaystyle х , !}$ отдельно мы можем определить правило принятия решения ${ displaystyle delta , !}$ указав для каждого ${ Displaystyle х , !}$ действие ${ Displaystyle дельта (х) , !}$ что минимизирует ожидаемые потери. Это известно как обобщенное правило Байеса относительно ${ Displaystyle пи ( тета) , !}$ . Может существовать более одного обобщенного правила Байеса, поскольку может быть несколько вариантов ${ Displaystyle дельта (х) , !}$ которые приносят такой же ожидаемый убыток.

На первый взгляд, это может показаться несколько отличным от подхода правила Байеса из предыдущего раздела, а не обобщением. Однако обратите внимание, что риск Байеса уже в среднем превышает ${ Displaystyle Theta , !}$ байесовским способом, и байесовский риск может быть восстановлен, если ожидания превышают ${ displaystyle { mathcal {X}}}$ ожидаемого убытка (где ${ Displaystyle х сим тета , !}$ и ${ Displaystyle тета сим пи , !}$ ). Грубо говоря, ${ displaystyle delta , !}$ минимизирует это ожидание ожидаемых потерь (т. е. является правилом Байеса) тогда и только тогда, когда оно минимизирует ожидаемые убытки для каждого ${ displaystyle x in { mathcal {X}}}$ отдельно (т.е. является обобщенным правилом Байеса).

Тогда почему понятие обобщенного правила Байеса является улучшением? Это действительно эквивалентно понятию правила Байеса, когда правило Байеса существует и все ${ Displaystyle х , !}$ имеют положительную вероятность. Однако правила Байеса не существует, если риск Байеса бесконечен (для всех ${ displaystyle delta , !}$ ). В этом случае по-прежнему полезно определить обобщенное правило Байеса. ${ displaystyle delta , !}$ , который, по крайней мере, выбирает действие с минимальным ожидаемым убытком ${ Displaystyle дельта (х) ! ,}$ для тех ${ Displaystyle х , !}$ для которого действительно существует действие с конечными ожидаемыми потерями. Кроме того, может оказаться желательным обобщенное правило Байеса, поскольку оно должно выбирать действие с минимальными ожидаемыми потерями. ${ Displaystyle дельта (х) , !}$ за каждый ${ Displaystyle х , !}$ , тогда как правилу Байеса разрешено отклоняться от этой политики на множестве ${ Displaystyle X substeq { mathcal {X}}}$ меры 0 без влияния на байесовский риск.

Что еще более важно, иногда удобно использовать неподходящий предварительный ${ Displaystyle пи ( тета) , !}$ . В этом случае риск Байеса даже не определен четко, и нет четкого распределения по ${ Displaystyle х , !}$ . Однако задний ${ Displaystyle пи ( тета середина х) , !}$ - и, следовательно, ожидаемые убытки - могут быть четко определены для каждого ${ Displaystyle х , !}$ , так что по-прежнему можно определить обобщенное правило Байеса.

Допустимость (обобщенных) правил Байеса

Согласно теоремам о полных классах, при мягких условиях каждое допустимое правило является (обобщенным) правилом Байеса (относительно некоторого предшествующего ${ Displaystyle пи ( тета) , !}$ - возможно, неправильный - в пользу распределений ${ Displaystyle тета , !}$ где это правило обеспечивает низкий риск). Таким образом, в частотник теория принятия решений достаточно рассмотреть только (обобщенные) правила Байеса.

И наоборот, хотя правила Байеса относительно собственных априорных значений практически всегда допустимы, обобщенные правила Байеса, соответствующие неподходящие приоры не требует допустимых процедур. Пример Штейна одна из таких известных ситуаций.

Примеры

В Оценка Джеймса – Стейна представляет собой нелинейную оценку среднего гауссовских случайных векторов, которая, как можно показать, доминирует или превосходит обыкновенный метод наименьших квадратов метод по среднеквадратичной функции потерь ошибок.^[2] Таким образом, оценка методом наименьших квадратов не является допустимой процедурой оценки в данном контексте. Некоторые другие стандартные оценки, связанные с нормальное распределение также недопустимы: например, выборочная оценка дисперсии когда среднее значение и дисперсия генеральной совокупности неизвестны.^[3]

Примечания

^ Додж, Ю. (2003) Оксфордский словарь статистических терминов. ОУП. ISBN 0-19-920613-9 (запись для допустимой решающей функции)
^ Кокс и Хинкли 1974, Раздел 11.8
^ Кокс и Хинкли 1974, Упражнение 11.7