Рандомизированное правило принятия решения - Randomised decision rule - Wikipedia

В статистических теория принятия решений, а правило рандомизированного решения или же смешанное правило принятия решений это правило принятия решения который связывает вероятности с детерминированными правилами принятия решений. В задачах с конечными решениями рандомизированные решающие правила определяют набор рисков какой выпуклый корпус точек риска нерандомизированных правил принятия решений.

Поскольку для рандомизированных правил Байеса всегда существуют нерандомизированные альтернативы, рандомизация не требуется. Байесовская статистика, несмотря на то что частотник Статистическая теория иногда требует использования рандомизированных правил для удовлетворения таких условий оптимальности, как минимакс, особенно при выводе доверительные интервалы и проверка гипотез о дискретные распределения вероятностей.

Определение и толкование

Позволять ${ displaystyle { mathcal {D}} = {d_ {1}, d_ {2} ..., d_ {h} }}$ быть набором нерандомизированных правил принятия решений с соответствующими вероятностями ${ displaystyle p_ {1}, p_ {2}, ..., p_ {h}}$ . Тогда рандомизированное решающее правило ${ displaystyle d ^ {*}}$ определяется как ${ Displaystyle сумма _ {я = 1} ^ {ч} р_ {я} д_ {я}}$ и связанные с ним функция риска ${ Displaystyle R ( theta, d ^ {*})}$ является ${ Displaystyle сумма _ {я = 1} ^ {h} p_ {i} R ( theta, d_ {i})}$ .^[1] Это правило можно рассматривать как случайное эксперимент в котором правила решения ${ displaystyle d_ {1}, ..., d_ {h} in { mathcal {D}}}$ выбираются с вероятностями ${ displaystyle p_ {1}, ... p_ {h}}$ соответственно.^[2]

В качестве альтернативы, случайное правило принятия решения может назначать вероятности непосредственно элементам пространства действий. ${ displaystyle { mathcal {A}}}$ для каждого члена выборочного пространства. Более формально ${ Displaystyle d ^ {*} (х, А)}$ обозначает вероятность того, что действие ${ displaystyle a in { mathcal {A}}}$ выбран. При таком подходе его функция потерь также определяется непосредственно как: ${ displaystyle int _ {A in { mathcal {A}}} d ^ {*} (x, A) L ( theta, A) dA}$ .^[3]

Таким образом, введение рандомизированных правил принятия решений создает большее пространство для принятия решений, из которого статистик может выбрать свое решение. Поскольку нерандомизированные решающие правила являются частным случаем рандомизированных решающих правил, в которых одно решение или действие имеет вероятность 1, исходное пространство решений ${ Displaystyle { mathcal {D}}}$ является правильным подмножеством нового пространства решений ${ Displaystyle { mathcal {D}} ^ {*}}$ .^[4]

Выбор рандомизированных правил принятия решений

Крайние точки множества рисков, обозначенные пустыми кружками, соответствуют нерандомизированным правилам принятия решений, а жирные линии обозначают допустимые правила принятия решений.

Как и нерандомизированные решающие правила, рандомизированные решающие правила могут удовлетворять благоприятным свойствам, таким как допустимость, минимаксность и байесовский подход. Это будет проиллюстрировано в случае задачи с конечным решением, т.е. задачи, в которой пространство параметров представляет собой конечный набор, скажем, ${ displaystyle k}$ Множество рисков, в дальнейшем обозначаемое как ${ Displaystyle { mathcal {S}}}$ , - это набор всех векторов, в которых каждая запись является значением функция риска связанный со случайным правилом принятия решений по определенному параметру: он содержит все векторы вида ${ displaystyle (R ( theta _ {1}, d ^ {*}), ... R ( theta _ {k}, d ^ {*})), d ^ {*} in { mathcal {D}} ^ {*}}$ . Обратите внимание, что по определению правила рандомизированного принятия решения набор рисков - это выпуклый корпус рисков ${ displaystyle (R ( theta _ {1}, d), ... R ( theta _ {k}, d)), d in { mathcal {D}}}$ .^[5]

В случае, когда пространство параметров имеет только два элемента ${ displaystyle theta _ {1}}$ и ${ displaystyle theta _ {2}}$ , это подмножество ${ Displaystyle mathbb {R} ^ {2}}$ , поэтому его можно нарисовать относительно осей координат ${ displaystyle R_ {1}}$ и ${ displaystyle R_ {2}}$ соответствующие риски под ${ displaystyle theta _ {1}}$ и ${ displaystyle theta _ {2}}$ соответственно.^[6] Пример показан справа.

Допустимость

An допустимое правило принятия решения - это правило, в котором не доминирует какое-либо другое правило принятия решения, то есть не существует правила принятия решения, которое имеет равный или меньший риск для всех параметров и строго более низкий риск, чем для некоторых параметров. В задаче с конечным решением точка риска допустимого правила принятия решения имеет либо более низкие координаты x, либо координаты y, чем все другие точки риска, либо, более формально, это набор правил с точками риска вида ${ Displaystyle (а, б)}$ такой, что ${ Displaystyle {(R_ {1}, R_ {2}): R_ {1} leq a, R_ {2} leq b } cap { mathcal {S}} = (a, b)}$ . Таким образом, левая часть нижней границы множества рисков представляет собой набор допустимых решающих правил.^[6]^[7]

Минимакс

Минимаксное правило Байеса сводит к минимуму риск супремума. ${ Displaystyle sup _ { theta in Theta} R ( theta, d ^ {*})}$ среди всех решающих правил в ${ Displaystyle { mathcal {D}} ^ {*}}$ . Иногда в этом отношении правило рандомизированного решения может работать лучше, чем все другие правила нерандомизированного решения.^[1]

В задаче конечного решения с двумя возможными параметрами правило минимакса можно найти, рассматривая семейство квадратов ${ Displaystyle Q (с) = {(R_ {1}, R_ {2}): 0 leq R_ {1} leq c, 0 leq R_ {2} leq c }}$ .^[8] Значение ${ displaystyle c}$ за самый маленький из таких квадратов, который касается ${ Displaystyle { mathcal {S}}}$ - минимаксный риск, а соответствующая точка или точки на множестве рисков - это минимаксное правило.

Если набор рисков пересекает линию ${ displaystyle R_ {1} = R_ {2}}$ , то допустимое решающее правило, лежащее на прямой, минимаксно. Если ${ displaystyle R_ {2}> R_ {1}}$ или же ${ displaystyle R_ {1}> R_ {2}}$ выполняется для каждой точки в наборе рисков, то правило минимакса может быть либо крайней точкой (т. е. нерандомизированным правилом принятия решения), либо линией, соединяющей две крайние точки (нерандомизированные правила принятия решения).^[9]^[6]

Правило минимакса - это правило рандомизированного решения. ${ displaystyle (1-p) d_ {1} + pd_ {2}}$ .
Правило минимакса ${ displaystyle d_ {2}}$ .
Все правила минимакса - это правила в форме ${ displaystyle (1-p) d_ {1} + pd_ {2}}$ , ${ displaystyle 0 leq p leq 1}$ .

Байесовский

Рандомизированное правило Байеса - это правило, имеющее нижнюю границу Байесовский риск ${ Displaystyle г ( пи, d ^ {*})}$ среди всех решающих правил. В особом случае, когда пространство параметров состоит из двух элементов, строка ${ displaystyle pi _ {1} R_ {1} + (1- pi _ {1}) R_ {2} = c}$ , куда ${ displaystyle pi _ {1}}$ и ${ displaystyle pi _ {2}}$ обозначают априорные вероятности ${ displaystyle theta _ {1}}$ и ${ displaystyle theta _ {2}}$ соответственно, семейство точек с байесовским риском ${ displaystyle c}$ . Таким образом, минимальный байесовский риск для проблемы решения является наименьшим. ${ displaystyle c}$ так, чтобы линия касалась набора рисков.^[10]^[11] Эта линия может касаться только одной крайней точки набора рисков, т.е. соответствовать нерандомизированному правилу принятия решений, или перекрываться со всей стороной набора рисков, то есть соответствовать двум нерандомизированным правилам принятия решений и правилам рандомизированного принятия решений, объединяющим их. Это иллюстрируется тремя ситуациями ниже:

Правила Байеса - это набор решающих правил в форме ${ displaystyle (1-p) d_ {1} + pd_ {2}}$ , ${ displaystyle 0 leq p leq 1}$ .
Правило Байеса ${ displaystyle d_ {1}}$ .
Правило Байеса ${ displaystyle d_ {2}}$ .

Поскольку разные априорные значения приводят к разным наклонам, набор всех правил, которые являются байесовскими по отношению к некоторым априорным, совпадает с набором допустимых правил.^[12]

Обратите внимание, что невозможна ситуация, когда нерандомизированное правило Байеса не существует, но существует случайное правило Байеса. Существование рандомизированного правила Байеса подразумевает существование нерандомизированного правила Байеса. Это также верно в общем случае, даже с бесконечным пространством параметров, бесконечным байесовским риском и независимо от того, может ли быть достигнут бесконечный байесовский риск.^[3]^[12] Это поддерживает интуитивное представление о том, что статистику не нужно использовать рандомизацию для принятия статистических решений.^[4]

На практике

Поскольку у рандомизированных правил Байеса всегда есть нерандомизированные альтернативы, они не нужны в Байесовская статистика. Однако в частотной статистике рандомизированные правила теоретически необходимы в определенных ситуациях,^[13] и считались полезными на практике, когда они были впервые изобретены: Эгон Пирсон прогнозируют, что они «не встретят резких возражений».^[14] Однако в настоящее время немногие статистики действительно применяют их.^[14]^[15]

Рандомизированный тест

В обычной формулировке тест отношения правдоподобия, то нулевая гипотеза отклоняется всякий раз, когда отношение правдоподобия ${ displaystyle Lambda}$ меньше некоторой константы ${ displaystyle K}$ , и принимается иначе. Однако это иногда проблематично, когда ${ displaystyle Lambda}$ является дискретный при нулевой гипотезе, когда ${ displaystyle Lambda = K}$ возможно.

Решение состоит в том, чтобы определить функция тестирования ${ Displaystyle фи (х)}$ , значение которой является вероятностью принятия нулевой гипотезы:^[16]^[17]

${ displaystyle phi (x) = left {{ begin {array} {l} 1 & { text {if}} Lambda> K p (x) & { text {if}} Lambda = K 0 & { text {if}} Lambda$

Это можно интерпретировать как подбрасывание необъективной монеты с вероятностью ${ displaystyle p (x)}$ возвращать головы всякий раз, когда ${ displaystyle Lambda = k}$ и отвергая нулевую гипотезу, если кричит.^[15]

Обобщенная форма Лемма Неймана-Пирсона заявляет, что этот тест имеет максимальную мощность среди всех тестов на одном уровне значимости ${ displaystyle alpha}$ , что такой тест должен существовать для любого уровня значимости ${ displaystyle alpha}$ , и что тест уникален в нормальных ситуациях.^[18]

В качестве примера рассмотрим случай, когда базовое распределение Бернулли с вероятностью ${ displaystyle p}$ , и мы хотели бы проверить нулевую гипотезу ${ displaystyle p leq lambda}$ против альтернативной гипотезы ${ displaystyle p> lambda}$ . Естественно выбрать несколько ${ displaystyle k}$ такой, что ${ displaystyle P ({ hat {p}}> к | H_ {0}) = alpha}$ , и отклонять нуль всякий раз, когда ${ displaystyle { hat {p}}> k}$ , куда ${ displaystyle { hat {p}}}$ это тестовая статистика. Однако, чтобы учесть случаи, когда ${ displaystyle { hat {p}} = k}$ , определяем тестовую функцию:

${ displaystyle phi (x) = left {{ begin {array} {l} 1 & { text {if}} { hat {p}}> k gamma & { text {if} } { hat {p}} = k 0 & { text {if}} { hat {p}}$

куда ${ displaystyle gamma}$ выбирается так, что ${ displaystyle P ({ hat {p}}> k | H_ {0}) + gamma P ({ hat {p}} = k | H_ {0}) = alpha}$ .

Рандомизированные доверительные интервалы

Аналогичная проблема возникает при построении доверительных интервалов. Например, Интервал Клоппера-Пирсона всегда консервативен из-за дискретного характера биномиального распределения. Альтернативой является определение верхнего и нижнего доверительных интервалов. ${ displaystyle U}$ и ${ displaystyle L}$ путем решения следующих уравнений:^[14]

${ displaystyle left {{ begin {array} {l} Pr ({ hat {p}} k | p = L) + gamma P ({ hat {p}} = k | p = L) & = alpha / 2 end {array}} right.}$

куда ${ displaystyle gamma}$ это однородная случайная величина на (0, 1).

Смотрите также

Сноски

^ ^а ^б Янг и Смит, стр. 11
^ Бикель и Доксум, с. 28
^ ^а ^б Пармиджани, стр. 132
^ ^а ^б ДеГрут, стр.128-129.
^ Бикель и Доксум, стр.29
^ ^а ^б ^c Янг и Смит, стр.12
^ Бикель и Доксум, с. 32
^ Бикель и Доксум, стр.30
^ Янг и Смит, стр.14–16.
^ Янг и Смит, стр. 13
^ Бикель и Доксум, стр. 29–30.
^ ^а ^б Бикель и Доксум, стр.31
^ Роберт, стр.66
^ ^а ^б ^c Агрести и Готтард, стр.367
^ ^а ^б Бикель и Доксум, с.224.
^ Янг и Смит, стр.68.
^ Роберт, стр.243
^ Янг и Смит, стр.68.

Библиография

Агрести, Алан; Готтард, Анна (2005). «Комментарий: рандомизированные доверительные интервалы и подход среднего значения» (PDF). Статистическая наука. 5 (4): 367–371. Дои:10.1214/088342305000000403.
Бикель, Питер Дж .; Доксум, Челл А. (2001). Математическая статистика: основные идеи и избранные темы (2-е изд.). Река Аппер Сэдл, штат Нью-Джерси: Прентис-Холл. ISBN 978-0138503635.
ДеГрут, Моррис Х. (2004). Оптимальные статистические решения. Хобокен, штат Нью-Джерси: Wiley-Interscience. ISBN 978-0471680291.
Пармиджани, Джованни; Иноуэ, Лурдес Ю. Т. (2009). Теория принятия решений: принципы и подходы. Чичестер, Западный Суссекс: Джон Вили и сыновья. ISBN 9780470746684.
Роберт, Кристиан П. (2007). Байесовский выбор: от основ теории принятия решений до вычислительной реализации. Нью-Йорк: Спрингер. ISBN 9780387715988.
Young, G.A .; Смит, Р.Л. (2005). Основы статистического вывода. Кембридж: Издательство Кембриджского университета. ISBN 9780521548663.

[ys11-1] а ^б Янг и Смит, стр. 11

[2] Бикель и Доксум, с. 28

[parm-3] а ^б Пармиджани, стр. 132

[groot-4] а ^б ДеГрут, стр.128-129.

[bd29-5] Бикель и Доксум, стр.29

[ys12-6] а ^б ^c Янг и Смит, стр.12

[7] Бикель и Доксум, с. 32

[bd30-8] Бикель и Доксум, стр.30

[9] Янг и Смит, стр.14–16.

[10] Янг и Смит, стр. 13

[11] Бикель и Доксум, стр. 29–30.

[bd31-12] а ^б Бикель и Доксум, стр.31

[13] Роберт, стр.66

[ag-14] а ^б ^c Агрести и Готтард, стр.367

[bd224-15] а ^б Бикель и Доксум, с.224.

[16] Янг и Смит, стр.68.

[17] Роберт, стр.243

[18] Янг и Смит, стр.68.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]