Допустимое правило принятия решения - Admissible decision rule

В теория статистических решений, допустимое правило принятия решения это правило для принятия решения так что нет другого правила, которое всегда "лучше", чем это[1] (или, по крайней мере, иногда лучше и никогда не хуже) в точном смысле слова «лучше», определяемом ниже. Эта концепция аналогична Парето эффективность.

Определение

Определять наборы , и , куда состояния природы, возможные наблюдения и действия, которые могут быть предприняты. Наблюдение распространяется как и поэтому предоставляет свидетельства о состоянии природы . А правило принятия решения это функция , где при наблюдении , мы решили действовать .

Также определите функция потерь , который указывает убыток, который мы понесем, приняв меры когда истинное состояние природы . Обычно мы предпринимаем это действие после просмотра данных. , так что убыток будет . (Можно, хотя и нетрадиционно, переформулировать следующие определения в терминах вспомогательная функция, что является отрицательной величиной потерь.)

Определить функция риска как ожидание

Правило ли решения имеет низкий риск зависит от истинного состояния природы . Правило принятия решения доминирует правило принятия решения если и только если для всех , и неравенство строгий для некоторых .

Правило принятия решения допустимый (относительно функции потерь) тогда и только тогда, когда никакое другое правило не доминирует над ней; в противном случае это недопустимый. Таким образом, допустимое правило принятия решения - это максимальный элемент в отношении указанного выше частичного порядка. недопустимое правило не является предпочтительным (за исключением соображений простоты или вычислительной эффективности), поскольку по определению существует какое-то другое правило, которое позволит достичь равного или меньшего риска для все . Но только потому, что правило допустимо, не означает, что это хорошее правило. Приемлемость означает, что нет другого единственного правила, которое всегда так же хорошо или лучше - но другие допустимые правила могут снизить риск для большинства что происходит на практике. (Байесовский риск, обсуждаемый ниже, представляет собой способ явно рассмотреть, какие встречаются на практике.)

Правила Байеса и обобщенные правила Байеса

Правила Байеса

Позволять - распределение вероятностей состояний природы. Из Байесовский точки зрения, мы рассматриваем это как предварительное распространение. То есть это наше предполагаемое распределение вероятностей состояний природы до данных наблюдений. Для частотник, это просто функция на без такой специальной интерпретации. В Байесовский риск правила принятия решения относительно это ожидание

Правило принятия решения что сводит к минимуму называется Правило Байеса относительно . Таких правил Байеса может быть несколько. Если байесовский риск бесконечен для всех , то правило Байеса не определено.

Обобщенные правила Байеса

В байесовском подходе к теории принятия решений наблюдаемое Считается фиксированный. В то время как частотный подход (т.е. риск) усредняет возможные выборки , байесовский фиксирует наблюдаемый образец и среднее значение по гипотезам . Таким образом, байесовский подход должен учитывать наши наблюдаемые то ожидаемый убыток

где ожидание превышает задний из данный (получен из и с помощью Теорема Байеса ).

Сделав явным ожидаемый убыток для каждого данного отдельно мы можем определить правило принятия решения указав для каждого действие что минимизирует ожидаемые потери. Это известно как обобщенное правило Байеса относительно . Может существовать более одного обобщенного правила Байеса, поскольку может быть несколько вариантов которые приносят такой же ожидаемый убыток.

На первый взгляд, это может показаться несколько отличным от подхода правила Байеса из предыдущего раздела, а не обобщением. Однако обратите внимание, что риск Байеса уже в среднем превышает байесовским способом, и байесовский риск может быть восстановлен, если ожидания превышают ожидаемого убытка (где и ). Грубо говоря, минимизирует это ожидание ожидаемых потерь (т. е. является правилом Байеса) тогда и только тогда, когда оно минимизирует ожидаемые убытки для каждого отдельно (т.е. является обобщенным правилом Байеса).

Тогда почему понятие обобщенного правила Байеса является улучшением? Это действительно эквивалентно понятию правила Байеса, когда правило Байеса существует и все имеют положительную вероятность. Однако правила Байеса не существует, если риск Байеса бесконечен (для всех ). В этом случае по-прежнему полезно определить обобщенное правило Байеса. , который, по крайней мере, выбирает действие с минимальным ожидаемым убытком для тех для которого действительно существует действие с конечными ожидаемыми потерями. Кроме того, может оказаться желательным обобщенное правило Байеса, поскольку оно должно выбирать действие с минимальными ожидаемыми потерями. за каждый , тогда как правилу Байеса разрешено отклоняться от этой политики на множестве меры 0 без влияния на байесовский риск.

Что еще более важно, иногда удобно использовать неподходящий предварительный . В этом случае риск Байеса даже не определен четко, и нет четкого распределения по . Однако задний - и, следовательно, ожидаемые убытки - могут быть четко определены для каждого , так что по-прежнему можно определить обобщенное правило Байеса.

Допустимость (обобщенных) правил Байеса

Согласно теоремам о полных классах, при мягких условиях каждое допустимое правило является (обобщенным) правилом Байеса (относительно некоторого предшествующего - возможно, неправильный - в пользу распределений где это правило обеспечивает низкий риск). Таким образом, в частотник теория принятия решений достаточно рассмотреть только (обобщенные) правила Байеса.

И наоборот, хотя правила Байеса относительно собственных априорных значений практически всегда допустимы, обобщенные правила Байеса, соответствующие неподходящие приоры не требует допустимых процедур. Пример Штейна одна из таких известных ситуаций.

Примеры

В Оценка Джеймса – Стейна представляет собой нелинейную оценку среднего гауссовских случайных векторов, которая, как можно показать, доминирует или превосходит обыкновенный метод наименьших квадратов метод по среднеквадратичной функции потерь ошибок.[2] Таким образом, оценка методом наименьших квадратов не является допустимой процедурой оценки в данном контексте. Некоторые другие стандартные оценки, связанные с нормальное распределение также недопустимы: например, выборочная оценка дисперсии когда среднее значение и дисперсия генеральной совокупности неизвестны.[3]

Примечания

  1. ^ Додж, Ю. (2003) Оксфордский словарь статистических терминов. ОУП. ISBN  0-19-920613-9 (запись для допустимой решающей функции)
  2. ^ Кокс и Хинкли 1974, Раздел 11.8
  3. ^ Кокс и Хинкли 1974, Упражнение 11.7

Рекомендации

  • Cox, D. R .; Хинкли, Д. В. (1974). Теоретическая статистика. Вайли. ISBN  0-412-12420-3.CS1 maint: ref = harv (связь)
  • Бергер, Джеймс О. (1980). Статистическая теория принятия решений и байесовский анализ (2-е изд.). Springer-Verlag. ISBN  0-387-96098-8.
  • ДеГрут, Моррис (2004) [1-е. паб. 1970]. Оптимальные статистические решения. Библиотека Wiley Classics. ISBN  0-471-68029-X.
  • Роберт, Кристиан П. (1994). Байесовский выбор. Springer-Verlag. ISBN  3-540-94296-3.