Теорема о полезности фон Неймана – Моргенштерна - Von Neumann–Morgenstern utility theorem - Wikipedia

В теория принятия решений, то фон Нейман-Моргенштерн (или же VNM) теорема полезности показывает, что при определенных аксиомы из рациональное поведение, лицо, принимающее решения, столкнулось с рискованно (вероятностные) результаты различных выборов будут вести себя так, как если бы он или она максимизировали ожидаемое значение некоторой функции, определенной для потенциальных результатов в определенный момент в будущем. Эта функция известна как функция полезности фон Неймана – Моргенштерна. Теорема является основой теория ожидаемой полезности.

В 1947 г. Джон фон Нейман и Оскар Моргенштерн доказал, что любой человек, чей предпочтения удовлетворенные четыре аксиомы имеют вспомогательная функция;^[1] предпочтения такого человека могут быть представлены на шкала интервалов и человек всегда будет отдавать предпочтение действиям, которые максимизируют ожидаемую полезность. То есть они доказали, что агент (VNM-) рациональный если и только если существует действительная функция ты определяется возможными результатами, так что каждое предпочтение агента характеризуется максимизацией ожидаемой стоимости ты, который затем можно определить как агент VNM-утилита (он уникален до добавления константы и умножения на положительный скаляр). Не утверждается, что агент имеет «сознательное желание» максимизировать ты, только это ты существуют.

В гипотеза ожидаемой полезности состоит в том, что рациональность можно смоделировать как максимизацию ожидаемое значение, который, учитывая теорему, можно резюмировать как "рациональность - это ВНМ-рациональность". Однако сами аксиомы подвергались критике по разным причинам, в результате чего аксиомы получили дополнительное обоснование.^[2]

VNM-утилита - это полезность решения в том, что он используется для описания предпочтения по решению. Это связано, но не эквивалентно так называемому Электронные утилиты^[3] (полезности опыта), понятия полезности, предназначенные для измерения счастья, такие как Бентам с Принцип величайшего счастья.

Настраивать

В теореме отдельный агент сталкивается с вариантами, называемыми лотереи. Учитывая некоторые взаимоисключающий результатов, лотерея - это сценарий, в котором каждый результат произойдет с заданным вероятность, сумма всех вероятностей к единице. Например, для двух исходов А и B,

{ displaystyle L = 0,25A + 0,75B}

обозначает сценарий, в котором п(А) = 25% - вероятность А происходящие и п(B) = 75% (и произойдет ровно одно из них). В общем, для лотереи с множеством возможных исходов А_я, мы пишем:

{ Displaystyle L = сумма p_ {i} A_ {i},}

с суммой ${ displaystyle p_ {i}}$ s равняется 1.

Результаты лотереи сами могут быть лотереями между другими исходами, и расширенное выражение считается эквивалентной лотереей: 0,5 (0,5А + 0.5B) + 0.5C = 0.25А + 0.25B + 0.50C.

Если лотерея M предпочтительнее лотереи L, мы пишем ${ Displaystyle L Prec M}$ , или эквивалентно, ${ Displaystyle M succ L}$ . Если агенту безразлично L иM, мы пишем отношение безразличия^[4] ${ displaystyle L sim M.}$ Если M либо предпочтительнее, либо рассматривается безразлично по отношению к L, мы пишем ${ Displaystyle L prevq M.}$

Аксиомы

Тогда четыре аксиомы VNM-рациональности таковы: полнота, транзитивность, непрерывность, и независимость.

Полнота предполагает, что у человека есть четко определенные предпочтения:

Аксиома 1 (Полнота) Для любых лотерей L, M, выполняется ровно одно из следующего:

{ Displaystyle , L Prec M}

,

{ Displaystyle , М пре L}

, или же

{ displaystyle , L sim M}

(либо M предпочтительно, L предпочтительнее, или человек безразличен^[5]).

Транзитивность предполагает, что предпочтения одинаковы для любых трех вариантов:

Аксиома 2 (Транзитивность) Если

{ Displaystyle , L Prec M}

и

{ Displaystyle , М пре N}

, тогда

{ Displaystyle , L Prec N}

, и аналогично для

{ displaystyle sim}

.

Непрерывность предполагает, что существует «переломный момент» между тем, чтобы быть лучше чем и хуже чем данный средний вариант:

Аксиома 3 (Непрерывность): Если

{ Displaystyle , L prevq M prevq N}

, то существует вероятность

{ Displaystyle , п в [0,1]}

такой, что

{ Displaystyle , pL + (1-p) N , sim , M}

где обозначение в левой части относится к ситуации, в которой L получено с вероятностью п и N получено с вероятностью (1–п).

Вместо непрерывности можно принять альтернативную аксиому, не предполагающую точного равенства, называемую Архимедова собственность.^[4] В нем говорится, что любое разделение предпочтений может сохраняться при достаточно небольшом отклонении вероятностей:

Аксиома 3 ′ (свойство Архимеда): Если

{ Displaystyle , Л пре М пре Н}

, то существует вероятность

{ Displaystyle , varepsilon in (0,1)}

такой, что

{ Displaystyle , (1- varepsilon) L + varepsilon N , Prec , M , Prec , varepsilon L + (1- varepsilon) N.}

Необходимо принять только одно из (3) или (3 ′), а другое будет подразумеваться теоремой.

Независимость от нерелевантных альтернатив предполагает, что предпочтение сохраняется независимо от возможности другого исхода:

Аксиома 4 (Независимость): Для любого

{ displaystyle , N}

и

{ Displaystyle , п в (0,1]}

,

{ Displaystyle , L prevq M qquad iff qquad pL + (1-p) N prevq pM + (1-p) N.}

Из аксиомы независимости следует аксиома о сокращении составных лотерей:^[6]

Аксиома 4 ′ (Сокращение составных лотерей): Для любых лотерей

{ Displaystyle L, L ', N, N'}

и любой

{ displaystyle p, q in [0,1]}

,

{ Displaystyle, если qquad L sim qL '+ (1-q) N',}

{ displaystyle then quad pL + (1-p) N sim pqL '+ p (1-q) N' + (1-p) N.}

Чтобы увидеть, как из аксиомы 4 следует аксиома 4 ', установите ${ Displaystyle M = qL '+ (1-q) N'}$ в выражении в аксиоме 4 и разверните.

Теорема

Для любого VNM-рационального агента (т.е. удовлетворяющего аксиомам 1–4) существует функция ты который присваивает каждому результату А реальное число u (A) так что для любых двух лотерей

{ Displaystyle L Pre M qquad mathrm {если и , только , если} qquad E (u (L))

куда E (u (L)), или короче Европа(L) дан кем-то

{ displaystyle Eu (p_ {1} A_ {1} + ldots + p_ {n} A_ {n}) = p_ {1} u (A_ {1}) + cdots + p_ {n} u (A_ { n}).}

В качестве таких, ты можно однозначно определить (вплоть до добавления константы и умножения на положительный скаляр) предпочтениями между простые лотереи, имея в виду те, которые имеют форму pA + (1 − п)B имея только два результата. И наоборот, любой агент, действующий так, чтобы максимизировать ожидание функции ты будет подчиняться аксиомам 1–4. Такая функция называется агентской. утилита фон Неймана – Моргенштерна (VNM).

Доказательство эскиза

Доказательство конструктивно: оно показывает, как искомая функция ${ displaystyle u}$ можно построить. Здесь мы опишем процесс построения для случая, когда число надежных исходов конечно.^[7]^:132–134

Предположим, есть п верные результаты, ${ displaystyle A_ {1} dots A_ {n}}$ . Обратите внимание, что каждый надежный исход можно рассматривать как лотерею: это вырожденная лотерея, в которой исход выбирается с вероятностью 1. Следовательно, согласно аксиомам полноты и транзитивности, можно упорядочить исходы от худшего к лучшему:

{ Displaystyle A_ {1} prevq A_ {2} prevq cdots prevq A_ {n}}

Мы предполагаем, что хотя бы одно из неравенств является строгим (в противном случае функция полезности тривиальна - постоянна). Так ${ Displaystyle A_ {1} Prec A_ {n}}$ . Мы используем эти два крайних результата - худший и лучший - в качестве единицы масштабирования нашей функции полезности и определяем:

{ displaystyle u (A_ {1}) = 0}

и

{ Displaystyle и (А_ {п}) = 1}

Для каждой вероятности ${ displaystyle p in [0,1]}$ , определите лотерею, которая выбирает лучший результат с вероятностью ${ displaystyle p}$ и худший исход в противном случае:

{ Displaystyle L (p) = p cdot A_ {n} + (1-p) cdot A_ {1}}

Обратите внимание, что ${ Displaystyle L (0) sim A_ {1}}$ и ${ Displaystyle L (1) sim A_ {п}}$ .

Согласно аксиоме непрерывности, для каждого верного исхода ${ displaystyle A_ {i}}$ , есть вероятность ${ displaystyle q_ {i}}$ такой, что:

{ displaystyle L (q_ {i}) sim A_ {i}}

и

{ displaystyle 0 = q_ {1} leq q_ {2} leq cdots leq q_ {n} = 1}

Для каждого ${ displaystyle i}$ , функция полезности для результата ${ displaystyle A_ {i}}$ определяется как

{ displaystyle u (A_ {i}) = q_ {i}}

так что полезность каждой лотереи ${ Displaystyle М = сумма _ {я} {р_ {я} А_ {я}}}$ это ожидание ты:

{ Displaystyle и (М) = и ( сумма _ {я} {р_ {я} А_ {я}}) = сумма _ {я} {р_ {я} и (А_ {я})} = сумма _ {i} {p_ {i} q_ {i}}}

Чтобы понять, почему эта функция полезности имеет смысл, рассмотрим лотерею ${ Displaystyle М = сумма _ {я} {р_ {я} А_ {я}}}$ , который выбирает результат ${ displaystyle A_ {i}}$ с вероятностью ${ displaystyle p_ {i}}$ . Но, по нашему предположению, лицу, принимающему решение, безразлично, какой исход ${ displaystyle A_ {i}}$ и лотерея ${ displaystyle q_ {i} cdot A_ {n} + (1-q_ {i}) cdot A_ {1}}$ . Итак, по аксиоме редукции, ему безразличны лотереи. ${ displaystyle M}$ и следующая лотерея:

{ displaystyle M '= sum _ {i} {p_ {i} [q_ {i} cdot A_ {n} + (1-q_ {i}) cdot A_ {1}]}}

{ displaystyle M '= ( sum _ {i} {p_ {i} q_ {i}}) cdot A_ {n} + ( sum _ {i} {p_ {i} (1-q_ {i}) )}) cdot A_ {1}}

{ Displaystyle M '= U (M) cdot A_ {n} + (1-u (M)) cdot A_ {1}}

Лотерея ${ displaystyle M '}$ это, по сути, лотерея, в которой с вероятностью выигрывается лучший результат. ${ Displaystyle и (М)}$ , и худший исход в противном случае.

Следовательно, если ${ Displaystyle и (М)> и (L)}$ , рационально принимающий решения предпочел бы лотерею ${ displaystyle M}$ по лотерее ${ displaystyle L}$ , потому что это дает ему больше шансов выиграть лучший результат.

Следовательно:

{ Displaystyle L Prec M ;}

если и только если

{ Displaystyle E (u (L))

Реакция

Фон Нейман и Моргенштерн ожидали удивления силой своего заключения. Но, по их мнению, их функция полезности работает потому, что она построена именно для того, чтобы исполнять роль чего-то, чьи ожидания максимальны:

«Многие экономисты сочтут, что мы слишком много предполагаем ... Разве мы не показали слишком много? ... Насколько мы можем видеть, наши постулаты [являются] правдоподобными ... Мы практически определили числовую полезность как то, что вещь, для которой обоснован расчет математических ожиданий ". - ВНМ 1953, § 3.1.1 п.16 и § 3.7.1 п. 28^[1]

Таким образом, содержание теоремы состоит в том, что построение ты возможно, и они мало что говорят о его природе.

Последствия

Автоматический учет избегания риска

Часто бывает, что человек, столкнувшийся с реальным миром азартные игры с деньгами, не действует, чтобы максимизировать ожидаемую стоимость их долларовые активы. Например, человек, у которого есть сбережения всего в 1000 долларов, может не захотеть рискнуть всем ради 20% шансов на выигрыш 10000 долларов, даже если

{ Displaystyle 20 \% ( $ 10 , 000) +80 \% ( $ 0) = $ 2000> 100 \% ( $ 1000)}

Тем не мение, если человек является VNM-рациональным, такие факты автоматически учитываются в их функции полезности ты. В этом примере мы можем сделать вывод, что

{ Displaystyle 20 \% u ( $ 10 , 000) +80 \% u ( $ 0) <и ( $ 1000)}

где суммы в долларах здесь действительно представляют результаты (ср. "ценить "), три возможных ситуации, с которыми может столкнуться человек. В частности, ты может проявлять такие свойства, как ты($1)+ты($1) ≠ ты($ 2) вообще не противоречащий VNM-рациональности. Это приводит к количественной теории неприятие денежного риска.

Последствия для гипотезы ожидаемой полезности

В 1738 г. Даниэль Бернулли опубликовал трактат^[8] в котором он утверждает, что рациональное поведение можно описать как максимизацию ожидания функции ты, которые, в частности, не обязательно должны оцениваться в денежном выражении, что позволяет избежать неприятия риска. Это гипотеза ожидаемой полезности. Как уже говорилось, эта гипотеза может показаться смелой. Цель теорема ожидаемой полезности заключается в предоставлении "скромных условий" (т.е. аксиом), описывающих, когда выполняется гипотеза ожидаемой полезности, которые можно оценить напрямую и интуитивно:

«Аксиом не должно быть слишком много, их система должна быть как можно более простой и прозрачной, и каждая аксиома должна иметь непосредственное интуитивное значение, по которому можно напрямую судить о ее уместности. В такой ситуации, как наша, это последнее требование особенно важно , несмотря на ее расплывчатость: мы хотим сделать интуитивную концепцию доступной для математической обработки и увидеть как можно яснее, какие гипотезы для этого требуются ». - ВНМ 1953 § 3.5.2, с. 25^[1]

Таким образом, утверждения о том, что гипотеза ожидаемой полезности не характеризует рациональность, должны отвергать одну из аксиом VNM. Разнообразие обобщенная ожидаемая полезность Возникли теории, большинство из которых опускают или ослабляют аксиому независимости.

Значение для этики и моральной философии

Поскольку теорема ничего не предполагает о природе возможных исходов азартных игр, они могут быть морально значимыми событиями, например, связанными с жизнью, смертью, болезнью или здоровьем других. Рациональный агент фон Неймана-Моргенштерна способен действовать с большой заботой о таких событиях, жертвуя большим личным богатством или благополучием, и все эти действия будут учитываться при построении / определении функции VNM-полезности агента. Другими словами, как то, что естественно воспринимается как «личная выгода», так и то, что естественно воспринимается как «альтруизм», неявно сбалансированы в функции полезности VNM рационального индивида. Таким образом, весь спектр агент-ориентированный на агент-нейтральный поведение возможно с различными функциями VNM-утилит^{[требуется разъяснение ]}.

Если полезность ${ displaystyle N}$ является ${ displaystyle pM}$ , рациональный агент фон Неймана-Моргенштерна должен быть безразличен между ${ displaystyle 1N}$ и ${ displaystyle pM + (1-p) 0}$ . Следовательно, рациональный агент фон Неймана-Моргенштерна, ориентированный на агента, не может поддерживать более равное или «справедливое» распределение полезности между его собственными возможными будущими я.

Отличие от других представлений о полезности

Немного утилитарные моральные теории связаны с величинами, называемыми «общей полезностью» и «средней полезностью» коллективов, и характеризуют мораль с точки зрения одобрения полезности или счастья других при игнорировании собственного. Эти понятия могут быть связаны с VNM-утилитой, но отличны от нее:

1) VNM-утилита - это полезность решения:^[3] это то, на основании чего человек принимает решение, и поэтому по определению не может быть чем-то, что можно игнорировать.
2) VNM-полезность не является канонически аддитивной для нескольких индивидуумов (см. Ограничения), поэтому «общая VNM-полезность» и «средняя VNM-полезность» не имеют непосредственного значения (требуется какое-то предположение о нормализации).

Период, термин Электронная утилита для «полезности опыта» был придуман^[3] для обозначения типов «гедонистической» полезности, например, Бентам с принцип величайшего счастья. Поскольку мораль влияет на решения, мораль VNM-рационального агента будет влиять на определение его собственной функции полезности (см. Выше). Таким образом, мораль VNM-рационального агента можно охарактеризовать следующим образом: корреляция VNM-утилиты агента с VNM-утилитой, E-утилитой или "счастьем" других, среди прочего, но не с помощью игнорировать для собственной VNM-утилиты агента, противоречие в терминах.

Ограничения

Вложенные азартные игры

Поскольку если L и M лотереи, тогда pL + (1 − п)M просто «расширяется» и считается самой лотереей, формализм VNM игнорирует то, что может восприниматься как «вложенная игра». Это связано с Проблема Эллсберга где люди предпочитают избегать восприятия риски о рисках. Фон Нейман и Моргенштерн признали это ограничение:

"... такие концепции, как особая польза от азартных игр не могут быть сформулированы без противоречий на этом уровне. Это утверждение может показаться парадоксальным. Но любой, кто всерьез пытался аксиоматизировать эту неуловимую концепцию, вероятно, согласится с ней ». ВНМ 1953 § 3.7.1, с. 28.^[1]

Несопоставимость агентов

Поскольку для любых двух VNM-агентов Икс и Y, их служебные функции VNM ты_Икс и ты_Y определены только с точностью до аддитивных констант и мультипликативных положительных скаляров, теорема не предоставляет никакого канонического способа сравнения этих двух. Отсюда выражения вроде ты_Икс(L) + ты_Y(L) и ты_Икс(L) − ты_Y(L) не определены канонически, равно как и сравнения, подобные ты_Икс(L) < ты_Y(L) канонически верно или неверно. В частности, вышеупомянутые «общая VNM-полезность» и «средняя VNM-полезность» популяции не имеют канонического смысла без предположений о нормализации.

Применимость к экономике

В гипотеза ожидаемой полезности показано, что имеет ограниченную точность прогнозов в ряде лабораторных эмпирических экспериментов, таких как Парадокс Алле.Это заставляет некоторых людей интерпретировать как свидетельство того, что

люди не всегда рациональны, или
VNM-рациональность не является подходящей характеристикой рациональности, или
некоторая комбинация того и другого, или
люди делать вести себя VNM-рационально, но объективная оценка ты и строительство ты находятся несговорчивый проблемы.

Ссылки и дополнительная литература

^ ^а ^б ^c ^d Нойман, Джон фон и Моргенштерн, Оскар, Теория игр и экономического поведения. Принстон, штат Нью-Джерси. Издательство Принстонского университета, 1953.
^ Петерсон, Глава 8.
^ ^а ^б ^c Канеман; Ваккер; Зарин (1997). «Назад к Бентам? Исследования опытной полезности». Ежеквартальный журнал экономики. 112 (2): 375–406. Дои:10.1162/003355397555235. HDL:1765/23011.
^ ^а ^б Крепс, Дэвид М. Заметки о теории выбора. Westview Press (12 мая 1988 г.), главы 2 и 5.
^ При обозначении безразличия равенством подразумеваются утверждения типа if ${ Displaystyle L Prec M = N}$ тогда ${ Displaystyle L Prec N}$ . Чтобы сделать такие отношения явными в аксиомах, Крепс (1988), глава 2 обозначает безразличие следующим образом: ${ displaystyle , sim}$ , так что его можно кратко рассмотреть на предмет интуитивного значения.
^ ЭконПорт, "Теория ожидаемой полезности фон Неймана – Моргенштерна" http://www.econport.org/content/handbook/decisions-uncretety/basic/von.html
^ Кини, Ральф Л .; Райффа, Ховард (1993). Решения с несколькими целями. ISBN 0-521-44185-4.
^ Образец theoriae novae de mensura sortis или же Изложение новой теории измерения риска

Нэш, Джон Ф., мл. (1950). «Проблема торга». Econometrica. 18 (2): 155–162. Дои:10.2307/1907266. JSTOR 1907266.
Ананд, Пол. Основы рационального выбора в условиях риска Оксфорд, издательство Оксфордского университета. 1993 переиздано 1995, 2002
Фишберн, Питер С. Теория полезности для принятия решений. Хантингтон, штат Нью-Йорк. Роберт Э. Кригер Паблишинг Ко. 1970. ISBN 978-0-471-26060-8
Sixto Rios (1998) Некоторые проблемы и разработки в области науки принятия решений, Revista Matematica Complutense 11(1):113–41.
Петерсон, Мартин (2009). Введение в теорию принятия решений (Кембриджские введения в философию). Кембридж: Издательство Кембриджского университета.

[VNM-1] а ^б ^c ^d Нойман, Джон фон и Моргенштерн, Оскар, Теория игр и экономического поведения. Принстон, штат Нью-Джерси. Издательство Принстонского университета, 1953.

[2] Петерсон, Глава 8.

[KWS-3] а ^б ^c Канеман; Ваккер; Зарин (1997). «Назад к Бентам? Исследования опытной полезности». Ежеквартальный журнал экономики. 112 (2): 375–406. Дои:10.1162/003355397555235. HDL:1765/23011.

[Kreps-4] а ^б Крепс, Дэвид М. Заметки о теории выбора. Westview Press (12 мая 1988 г.), главы 2 и 5.

[nop-5] При обозначении безразличия равенством подразумеваются утверждения типа if ${ Displaystyle L Prec M = N}$ тогда ${ Displaystyle L Prec N}$ . Чтобы сделать такие отношения явными в аксиомах, Крепс (1988), глава 2 обозначает безразличие следующим образом: ${ displaystyle , sim}$ , так что его можно кратко рассмотреть на предмет интуитивного значения.

[6] ЭконПорт, "Теория ожидаемой полезности фон Неймана – Моргенштерна" http://www.econport.org/content/handbook/decisions-uncretety/basic/von.html

[KeeneyRaiffa1993-7] Кини, Ральф Л .; Райффа, Ховард (1993). Решения с несколькими целями. ISBN 0-521-44185-4.

[8] Образец theoriae novae de mensura sortis или же Изложение новой теории измерения риска

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]