Теорема о полезности фон Неймана – Моргенштерна

В теории принятия решений , то фон Нейман-Моргенштерн (или VNM ) теорема полезности показывает , что при определенных аксиомах из рационального поведения , принимают решения сталкиваются с рискованными (вероятностным) результатами различных вариантов будет вести себя так , как будто он или она максимизирует ожидаемым значение некоторой функции, определенной для потенциальных результатов в определенный момент в будущем. Эта функция известна как функция полезности фон Неймана – Моргенштерна. Теорема является основой теории ожидаемой полезности .

В 1947 году Джон фон Нейман и Оскар Моргенштерн доказали, что любой человек, чьи предпочтения удовлетворяют четырем аксиомам, имеет функцию полезности ; ^[1] предпочтения такого человека могут быть представлены в виде шкалы интервалов, и человек всегда будет отдавать предпочтение действиям, которые максимизируют ожидаемую полезность. То есть они доказали, что агент является (VNM-) рациональным тогда и только тогда, когда существует действительная функция u, определяемая возможными исходами, такая, что каждое предпочтение агента характеризуется максимизацией ожидаемого значения u , которое затем может определяться как VNM-утилита агента(он уникален до добавления константы и умножения на положительный скаляр). Не делается никаких заявлений о том, что агент имеет «сознательное желание» максимизировать u , только то, что u существует.

Гипотеза ожидаемой полезности состоит в том, что рациональность можно смоделировать как максимизацию ожидаемого значения , которое, учитывая теорему, можно резюмировать как « рациональность - это VNM-рациональность ». Однако сами аксиомы подвергались критике по разным причинам, в результате чего аксиомы получили дальнейшее обоснование. ^[2]

Утилита VNM - это утилита принятия решений, поскольку она используется для описания предпочтений принятия решений . Это связанно , но не эквивалентна , так называемые Е-утилит ^[3] (опыт коммунальных услуг), понятие полезности предназначено для измерения счастья , таких , как у Бентама «s Greatest Happiness принципа .

Настраивать

В теореме отдельный агент сталкивается с опционами, называемыми лотереями . Учитывая некоторые взаимоисключающие исходы, лотерея - это сценарий, в котором каждый исход произойдет с заданной вероятностью , при этом все вероятности в сумме равны единице. Например, для двух исходов A и B :

{\ displaystyle L = 0,25A + 0,75B}

обозначает сценарий, где P ( A ) = 25% - вероятность возникновения A , а P ( B ) = 75% (и произойдет ровно один из них). В более общем смысле, для лотереи с множеством возможных исходов A _i мы пишем:

{\ Displaystyle L = \ сумма p_ {i} A_ {i},}

с суммой ${\ displaystyle p_ {i}}$ s равняется 1.

Результаты в лотерее сами по себе могут быть лотереями между другими результатами, и расширенное выражение считается эквивалентной лотереей: 0,5 (0,5 + 0,5 B ) + 0,5 С = 0,25 + 0,25 В + 0,50 C .

Если лотерея M предпочтительнее лотереи L , мы пишем ${\ Displaystyle L \ Prec M}$ , или эквивалентно, ${\ Displaystyle M \ succ L}$ . Если агент безразличен между L и M , запишем отношение безразличия ^[4] ${\ displaystyle L \ sim M.}$ Если M предпочтительнее или рассматривается безразлично по отношению к L , мы пишем ${\ Displaystyle L \ Preq M.}$

Аксиомы

Таким образом, четыре аксиомы VNM-рациональности - это полнота , транзитивность , непрерывность и независимость .

Полнота предполагает, что у человека есть четко определенные предпочтения:

Аксиома 1 (полнота) Для любых лотерей L, M выполняется ровно одно из следующего:

{\ Displaystyle \, L \ Prec M}

,

{\ Displaystyle \, М \ пре L}

, или же

{\ displaystyle \, L \ sim M}

(либо M предпочтительнее, L предпочтительнее, либо индивидуум безразличен ^[5] ).

Транзитивность предполагает, что предпочтения одинаковы для любых трех вариантов:

Аксиома 2 (Транзитивность) Если

{\ Displaystyle \, L \ Prec M}

а также

{\ Displaystyle \, М \ пре N}

, тогда

{\ Displaystyle \, L \ Prec N}

, и аналогично для

{\ displaystyle \ sim}

.

Непрерывность предполагает, что существует «переломный момент» между тем, чтобы быть лучше и хуже, чем данный средний вариант:

Аксиома 3 (Непрерывность): Если

{\ Displaystyle \, L \ prevq M \ prevq N}

, то существует вероятность

{\ Displaystyle \, п \ в [0,1]}

такой, что

{\ Displaystyle \, pL + (1-р) N \, \ sim \, M}

где обозначение слева относится к ситуации, в которой L получено с вероятностью p, а N получено с вероятностью (1– p ).

Вместо непрерывности можно предположить альтернативную аксиому, которая не предполагает точного равенства, называемого свойством Архимеда . ^[4] В нем говорится, что любое разделение предпочтений может поддерживаться при достаточно малом отклонении вероятностей:

Аксиома 3 ′ (свойство Архимеда): Если

{\ Displaystyle \, Л \ пре М \ пре Н}

, то существует вероятность

{\ Displaystyle \, \ varepsilon \ в (0,1)}

такой, что

{\ Displaystyle \, (1- \ varepsilon) L + \ varepsilon N \, \ Prec \, M \, \ Prec \, \ varepsilon L + (1- \ varepsilon) N.}

Необходимо принять только одно из (3) или (3 ′), а другое будет подразумеваться теоремой.

Независимость нерелевантных альтернатив предполагает, что предпочтение сохраняется независимо от возможности другого результата:

Аксиома 4 (Независимость): Для любого

{\ displaystyle \, N}

а также

{\ Displaystyle \, п \ в (0,1]}

,

{\ Displaystyle \, L \ prevq M \ qquad iff \ qquad pL + (1-p) N \ prevq pM + (1-p) N.}

Из аксиомы независимости следует аксиома о сокращении составных лотерей: ^[6]

Аксиома 4 ′ (Уменьшение составных лотерей): Для любых лотерей.

{\ Displaystyle L, L ', N, N'}

и любой

{\ displaystyle p, q \ in [0,1]}

,

{\ Displaystyle, если \ qquad L \ sim qL '+ (1-q) N',}

{\ displaystyle then \ quad pL + (1-p) N \ sim pqL '+ p (1-q) N' + (1-p) N.}

Чтобы увидеть, как из аксиомы 4 следует аксиома 4 ', установите ${\ Displaystyle M = qL '+ (1-q) N'}$ в выражении в аксиоме 4 и разверните.

Теорема

Для любого VNM-рационального агента (т.е. удовлетворяющего аксиомам 1–4) существует функция u, которая присваивает каждому результату A действительное число u (A) такое, что для любых двух лотерей

{\ Displaystyle L \ Prec M \ qquad \ mathrm {если \, и \, только \, если} \ qquad E (u (L))

где E (u (L)) , или, короче, Eu ( L ) задается формулой

{\ displaystyle Eu (p_ {1} A_ {1} + \ ldots + p_ {n} A_ {n}) = p_ {1} u (A_ {1}) + \ cdots + p_ {n} u (A_ { n}).}

Таким образом, u может быть однозначно определено (вплоть до добавления константы и умножения на положительный скаляр) предпочтениями между простыми лотереями , то есть лотереями формы pA + (1 - p ) B, имеющими только два результата. И наоборот, любой агент, действующий, чтобы максимизировать математическое ожидание функции u, будет подчиняться аксиомам 1–4. Такая функция называется утилитой агента фон Неймана – Моргенштерна (VNM) .

Доказательство эскиза

Доказательство конструктивно: оно показывает, как искомая функция ${\ displaystyle u}$ можно построить. Здесь мы опишем процесс построения для случая, когда число надежных исходов конечно. ^[7]^{: 132–134}

Предположим, есть n верных результатов, ${\ displaystyle A_ {1} \ dots A_ {n}}$ . Обратите внимание, что каждый гарантированный результат можно рассматривать как лотерею: это вырожденная лотерея, в которой исход выбирается с вероятностью 1. Следовательно, согласно аксиомам полноты и транзитивности можно упорядочить исходы от худшего к лучшему:

{\ Displaystyle A_ {1} \ prevq A_ {2} \ prevq \ cdots \ prevq A_ {n}}

Мы предполагаем, что хотя бы одно из неравенств является строгим (в противном случае функция полезности тривиальна - постоянна). Так ${\ Displaystyle A_ {1} \ Prec A_ {n}}$ . Мы используем эти два крайних результата - худший и лучший - в качестве единицы масштабирования нашей функции полезности и определяем:

{\ displaystyle u (A_ {1}) = 0}

а также

{\ Displaystyle и (А_ {п}) = 1}

Для каждой вероятности ${\ displaystyle p \ in [0,1]}$ , определите лотерею, которая выбирает лучший результат с вероятностью ${\ displaystyle p}$ и худший исход в противном случае:

{\ displaystyle L (p) = p \ cdot A_ {n} + (1-p) \ cdot A_ {1}}

Обратите внимание, что ${\ Displaystyle L (0) \ sim A_ {1}}$ а также ${\ Displaystyle L (1) \ sim A_ {п}}$ .

Согласно аксиоме непрерывности, для каждого верного исхода ${\ displaystyle A_ {i}}$ , есть вероятность ${\ displaystyle q_ {i}}$ такой, что:

{\ displaystyle L (q_ {i}) \ sim A_ {i}}

а также

{\ displaystyle 0 = q_ {1} \ leq q_ {2} \ leq \ cdots \ leq q_ {n} = 1}

Для каждого ${\ displaystyle i}$ , функция полезности для результата ${\ displaystyle A_ {i}}$ определяется как

{\ displaystyle u (A_ {i}) = q_ {i}}

так что полезность каждой лотереи ${\ Displaystyle М = \ сумма _ {я} {р_ {я} А_ {я}}}$ это ожидание от u :

{\ Displaystyle и (М) = и (\ сумма _ {я} {р_ {я} А_ {я}}) = \ сумма _ {я} {р_ {я} и (А_ {я})} = \ сумма _ {i} {p_ {i} q_ {i}}}

Чтобы понять, почему эта функция полезности имеет смысл, рассмотрим лотерею. ${\ Displaystyle М = \ сумма _ {я} {р_ {я} А_ {я}}}$ , который выбирает результат ${\ displaystyle A_ {i}}$ с вероятностью ${\ displaystyle p_ {i}}$ . Но, по нашему предположению, лицу, принимающему решение, безразлично, какой исход ${\ displaystyle A_ {i}}$ и лотерея ${\ displaystyle q_ {i} \ cdot A_ {n} + (1-q_ {i}) \ cdot A_ {1}}$ . Итак, по аксиоме редукции, ему безразличны лотереи. ${\ displaystyle M}$ и следующая лотерея:

{\ displaystyle M '= \ sum _ {i} {p_ {i} [q_ {i} \ cdot A_ {n} + (1-q_ {i}) \ cdot A_ {1}]}}

{\ displaystyle M '= (\ sum _ {i} {p_ {i} q_ {i}}) \ cdot A_ {n} + (\ sum _ {i} {p_ {i} (1-q_ {i}) )}) \ cdot A_ {1}}

{\ Displaystyle M '= U (M) \ cdot A_ {n} + (1-u (M)) \ cdot A_ {1}}

Лотерея ${\ displaystyle M '}$ это, по сути, лотерея, в которой лучший результат выигрывается с вероятностью ${\ Displaystyle и (М)}$ , и худший исход в противном случае.

Следовательно, если ${\ Displaystyle и (М)> и (L)}$ , рационально принимающий решения предпочел бы лотерею ${\ displaystyle M}$ по лотерее ${\ displaystyle L}$ , потому что это дает ему больше шансов выиграть лучший результат.

Следовательно:

{\ Displaystyle L \ Prec M \;}

если и только если

{\ Displaystyle E (u (L))

Реакция

Фон Нейман и Моргенштерн ожидали удивления силой своего заключения. Но, по их словам, их функция полезности работает потому, что она построена именно для того, чтобы исполнять роль чего-то, чьи ожидания максимальны:

«Многие экономисты почувствуют, что мы слишком много предполагаем ... Разве мы не показали слишком много? ... Насколько мы можем видеть, наши постулаты [являются] правдоподобными ... Мы практически определили числовую полезность как то, что вещь, для которой обоснован расчет математических ожиданий ". - ВНМ 1953, § 3.1.1 п.16 и § 3.7.1 п. 28 ^[1]

Таким образом, содержание теоремы состоит в том, что построение u возможно, и они мало что говорят о его природе.

Последствия

Автоматический учет неприятия риска

Часто бывает, что человек, столкнувшийся с реальными азартными играми с деньгами, не пытается максимизировать ожидаемую стоимость своих долларовых активов. Например, человек, у которого есть сбережения всего в 1000 долларов, может не захотеть рискнуть всем ради 20% шансов выиграть 10000 долларов, даже если

{\ Displaystyle 20 \% (\ $ 10 \, 000) +80 \% (\ $ 0) = \ $ 2000> 100 \% (\ $ 1000)}

Однако, если человек является VNM-рациональным, такие факты автоматически учитываются в его функции полезности u . В этом примере мы могли бы сделать вывод, что

{\ Displaystyle 20 \% u (\ $ 10 \, 000) +80 \% u (\ $ 0) <и (\ $ 1000)}

где суммы в долларах здесь действительно представляют собой результаты (ср. « ценность »), три возможных ситуации, с которыми может столкнуться человек. В частности, u может проявлять свойства типа u ($ 1) + u ($ 1) ≠ u ($ 2), вообще не противореча VNM-рациональности. Это приводит к количественной теории неприятия монетарного риска.

Последствия для гипотезы ожидаемой полезности

В 1738 году Даниэль Бернулли опубликовал трактат ^[8], в котором он утверждает, что рациональное поведение можно описать как максимизацию ожидания функции u , которая, в частности, не обязательно должна быть оценена в денежном выражении, что объясняет уклонение от риска. Это гипотеза ожидаемой полезности . Как уже было сказано, эта гипотеза может показаться смелой. Цель теоремы об ожидаемой полезности - предоставить «скромные условия» (т. Е. Аксиомы), описывающие, когда выполняется гипотеза ожидаемой полезности, которые можно оценить напрямую и интуитивно:

«Аксиом не должно быть слишком много, их система должна быть как можно более простой и прозрачной, и каждая аксиома должна иметь непосредственное интуитивное значение, по которому можно напрямую судить о ее уместности. В такой ситуации, как наша, это последнее требование особенно важно. , несмотря на его расплывчатость: мы хотим сделать интуитивную концепцию доступной для математической обработки и увидеть как можно яснее, какие гипотезы для этого требуются ». - ВНМ 1953 § 3.5.2, с. 25 ^[1]

Таким образом, утверждения о том, что гипотеза ожидаемой полезности не характеризует рациональность, должны отвергать одну из аксиом VNM. Возникло множество обобщенных теорий ожидаемой полезности , большинство из которых отбрасывают или ослабляют аксиому независимости.

Значение для этики и моральной философии

Поскольку теорема ничего не предполагает о природе возможных исходов азартных игр, они могут быть морально значимыми событиями, например, связанными с жизнью, смертью, болезнью или здоровьем других. Рациональный агент фон Неймана-Моргенштерна способен действовать с большой заботой о таких событиях, жертвуя большим личным богатством или благополучием, и все эти действия будут влиять на построение / определение функции VNM-полезности агента. Другими словами, как то, что естественно воспринимается как «личная выгода», так и то, что естественно воспринимается как «альтруизм», неявно сбалансированы в функции полезности VNM рационального индивида. Таким образом, полный диапазон агентно-ориентированного и нейтрального по отношению к агенту поведения возможен с помощью различных служебных функций VNM ^{[ требуется пояснение ]} .

Если полезность ${\ displaystyle N}$ является ${\ displaystyle pM}$ , рациональному агенту фон Неймана – Моргенштерна должно быть безразлично ${\ displaystyle 1N}$ а также ${\ displaystyle pM + (1-p) 0}$ . Следовательно, рациональный агент фон Неймана-Моргенштерна, ориентированный на агента, не может поддерживать более равное или «справедливое» распределение полезности между его собственными возможными будущими «я».

Отличие от других представлений о полезности

Некоторые утилитарные моральные теории касаются величин, называемых «общей полезностью» и «средней полезностью» коллективов, и характеризуют мораль с точки зрения одобрения полезности или счастья других при игнорировании собственного. Эти понятия могут быть связаны с VNM-утилитой, но отличны от нее:

1) VNM-полезность - это полезность принятия решений : ^[3] это то, на основании чего человек принимает решение, и, следовательно, по определению не может быть чем-то, что можно игнорировать.
2) VNM-полезность не является канонически аддитивной для нескольких индивидуумов (см. Ограничения), поэтому «общая VNM-полезность» и «средняя VNM-полезность» не имеют непосредственного значения (требуется какое-то предположение о нормализации).

Термин E-утилита для «опыта полезности» была придумана ^[3] для обозначения типов «гедонистической» полезность , как у Бентама «s наибольший принцип счастья . Поскольку мораль влияет на решения, мораль VNM-рационального агента будет влиять на определение его собственной функции полезности (см. Выше). Таким образом, мораль VNM-рационального агента может быть охарактеризована корреляцией VNM-полезности агента с VNM-полезностью, E-полезностью или «счастьем» других, среди прочего, но не игнорированием собственного VNM-утилита, противоречие в терминах.

Ограничения

Вложенные азартные игры

Поскольку если L и M являются лотереями, то pL + (1 - p ) M просто «расширяется» и считается самой лотереей, формализм VNM игнорирует то, что может восприниматься как «вложенная игра». Это связано с проблемой Эллсберга, когда люди предпочитают избегать восприятия рисков относительно рисков . Фон Нейман и Моргенштерн признали это ограничение:

«... такие концепции, как особая полезность азартных игр, не могут быть сформулированы без противоречий на этом уровне. Это может показаться парадоксальным утверждением. Но любой, кто серьезно попытался аксиоматизировать эту неуловимую концепцию, вероятно, согласится с ней». - ВНМ 1953 § 3.7.1, с. 28 . ^[1]

Несравнимость между агентами

Поскольку для любых двух VNM-агентов X и Y их функции VNM-полезности u _X и u _Y определены только с точностью до аддитивных констант и мультипликативных положительных скаляров, теорема не предоставляет никакого канонического способа сравнения этих двух. Следовательно, выражения типа u _X ( L ) + u _Y ( L ) и u _X ( L ) - u _Y ( L ) не определены канонически, равно как и сравнения типа u _X ( L ) < u _Y ( L ) канонически верны или ложны. . В частности, вышеупомянутые «общая VNM-полезность» и «средняя VNM-полезность» популяции не могут быть канонически значимыми без предположений о нормализации.

Применимость к экономике

Показано, что гипотеза ожидаемой полезности имеет ограниченную точность прогнозов в ряде лабораторных эмпирических экспериментов, таких как парадокс Алле . Это заставляет некоторых людей интерпретировать как свидетельство того, что

люди не всегда рациональны, или
VNM-рациональность не является подходящей характеристикой рациональности, или
некоторая комбинация того и другого, или
люди действительно ведут себя VNM-рационально, но объективная оценка u и построение u - неразрешимые проблемы.

Ссылки и дополнительная литература

^ ^a b c d Нойман, Джон фон и Моргенштерн, Оскар , Теория игр и экономического поведения . Принстон, штат Нью-Джерси. Издательство Принстонского университета, 1953.
↑ Петерсон, Глава 8.
^ a b c Канеман; Ваккер; Зарин (1997). «Назад к Бентам? Исследования опытной полезности» . Ежеквартальный экономический журнал . 112 (2): 375–406. DOI : 10.1162 / 003355397555235 . hdl : 1765/23011 .
^ a b Крепс, Дэвид М. Заметки по теории выбора . Westview Press (12 мая 1988 г.), главы 2 и 5.
^ При обозначении безразличия равенством подразумеваются такие утверждения, как if ${\ Displaystyle L \ Prec M = N}$ тогда ${\ Displaystyle L \ Prec N}$ . Чтобы сделать такие отношения явными в аксиомах, Крепс (1988), глава 2 обозначает безразличие следующим образом: ${\ displaystyle \, \ sim}$ , так что его можно кратко рассмотреть на предмет интуитивного смысла.
^ EconPort, "Теория ожидаемой полезности фон Неймана – Моргенштерна" http://www.econport.org/content/handbook/decisions-uncretety/basic/von.html
^ Кини, Ральф Л .; Райффа, Ховард (1993). Решения с несколькими целями . ISBN 0-521-44185-4.
^ Образцы theoriae novae de mensura sortis или изложение новой теории измерения риска

Нэш, Джон Ф. младший (1950). «Проблема торга». Econometrica . 18 (2): 155–162. DOI : 10.2307 / 1907266 . JSTOR 1907266 . CS1 maint: обескураженный параметр ( ссылка )
Ананд, Пол. Основы рационального выбора в условиях риска Oxford, Oxford University Press. 1993 переиздано 1995, 2002
Фишберн, Питер С. Теория полезности для принятия решений . Хантингтон, штат Нью-Йорк. Роберт Э. Кригер Паблишинг Ко. 1970. ISBN 978-0-471-26060-8
Сиксто Риос (1998) Некоторые проблемы и достижения в науке о принятии решений , Revista Matematica Complutense 11 (1): 113–41.
Петерсон, Мартин (2009). Введение в теорию принятия решений (Кембриджские введения в философию) . Кембридж: Издательство Кембриджского университета.

[VNM-1] Нойман, Джон фон и Моргенштерн, Оскар , Теория игр и экономического поведения . Принстон, штат Нью-Джерси. Издательство Принстонского университета, 1953.

[2] Петерсон, Глава 8.

[KWS-3] Канеман; Ваккер; Зарин (1997). «Назад к Бентам? Исследования опытной полезности» . Ежеквартальный экономический журнал . 112 (2): 375–406. DOI : 10.1162 / 003355397555235 . hdl : 1765/23011 .

[Kreps-4] Крепс, Дэвид М. Заметки по теории выбора . Westview Press (12 мая 1988 г.), главы 2 и 5.

[nop-5] ^ При обозначении безразличия равенством подразумеваются такие утверждения, как if ${\ Displaystyle L \ Prec M = N}$ тогда ${\ Displaystyle L \ Prec N}$ . Чтобы сделать такие отношения явными в аксиомах, Крепс (1988), глава 2 обозначает безразличие следующим образом: ${\ displaystyle \, \ sim}$ , так что его можно кратко рассмотреть на предмет интуитивного смысла.

[6] EconPort, "Теория ожидаемой полезности фон Неймана – Моргенштерна" http://www.econport.org/content/handbook/decisions-uncretety/basic/von.html

[KeeneyRaiffa1993-7] Кини, Ральф Л .; Райффа, Ховард (1993). Решения с несколькими целями . ISBN 0-521-44185-4.

[8] Образцы theoriae novae de mensura sortis или изложение новой теории измерения риска

[1]