Из Википедии, бесплатной энциклопедии
  (Перенаправлен из составной лотереи )
Перейти к навигации Перейти к поиску

В теории принятия решений , то фон Нейман-Моргенштерн (или VNM ) теорема полезности показывает , что при определенных аксиомах из рационального поведения , принимают решения сталкиваются с рискованными (вероятностным) результатами различных вариантов будет вести себя так , как будто он или она максимизирует ожидаемым значение некоторой функции, определенной для потенциальных результатов в определенный момент в будущем. Эта функция известна как функция полезности фон Неймана – Моргенштерна. Теорема является основой теории ожидаемой полезности .

В 1947 году Джон фон Нейман и Оскар Моргенштерн доказали, что любой человек, чьи предпочтения удовлетворяют четырем аксиомам, имеет функцию полезности ; [1] предпочтения такого человека могут быть представлены в виде шкалы интервалов, и этот человек всегда будет отдавать предпочтение действиям, которые максимизируют ожидаемую полезность. То есть они доказали, что агент является (VNM-) рациональным тогда и только тогда, когда существует действительная функция u, определяемая возможными исходами, такая, что каждое предпочтение агента характеризуется максимизацией ожидаемого значения u , которое затем может определяться как VNM-утилита агента(он уникален до добавления константы и умножения на положительный скаляр). Не делается никаких заявлений о том, что агент имеет «сознательное желание» максимизировать u , только то, что u существует.

Гипотеза ожидаемой полезности состоит в том, что рациональность можно смоделировать как максимизацию ожидаемого значения , что, учитывая теорему, можно резюмировать как « рациональность - это VNM-рациональность ». Однако сами аксиомы подвергались критике по разным причинам, в результате чего аксиомы получили дальнейшее обоснование. [2]

Утилита VNM - это утилита принятия решений, поскольку она используется для описания предпочтений принятия решений . Это связанно , но не эквивалентна , так называемые Е-утилит [3] (опыт коммунальных услуг), понятие полезности предназначено для измерения счастья , таких , как у Бентама «s Greatest Happiness принципа .

Настройка [ править ]

В теореме отдельный агент сталкивается с опционами, называемыми лотереями . Учитывая некоторые взаимоисключающие исходы, лотерея - это сценарий, в котором каждый исход произойдет с заданной вероятностью , при этом все вероятности в сумме равны единице. Например, для двух исходов A и B :

обозначает сценарий, где P ( A ) = 25% - вероятность возникновения A , а P ( B ) = 75% (и произойдет ровно один из них). В более общем смысле, для лотереи с множеством возможных исходов A i мы пишем:

с суммой s равной 1.

Результаты в лотерее сами по себе могут быть лотереями между другими результатами, и расширенное выражение считается эквивалентной лотереей: 0,5 (0,5  + 0,5 B ) + 0,5 С = 0,25  + 0,25 В  + 0,50 C .

Если лотерейные М предпочтительнее , чем лотереи L , будет писать , или , что эквивалентно, . Если агент безразличен между L и  M , мы записываем отношение безразличия [4]. Если M предпочтительнее или рассматривается безразлично по отношению к L , мы пишем

Аксиомы [ править ]

Таким образом, четыре аксиомы VNM-рациональности - это полнота , транзитивность , непрерывность и независимость .

Полнота предполагает, что у человека есть четко определенные предпочтения:

Аксиома 1 (полнота) Для любых лотерей L, M выполняется ровно одно из следующего:
, Или

(либо M предпочтительнее, L предпочтительнее, либо индивидуум безразличен [5] ).

Транзитивность предполагает, что предпочтения одинаковы для любых трех вариантов:

Аксиома 2 (Транзитивность) Если и , то и аналогично для .

Непрерывность предполагает, что существует «переломный момент» между тем, чтобы быть лучше и хуже, чем данный средний вариант:

Аксиома 3 (Непрерывность): Если , то существует вероятность такая, что

где обозначение слева относится к ситуации, в которой L получено с вероятностью p, а N получено с вероятностью (1– p ).

Вместо непрерывности можно предположить альтернативную аксиому, которая не предполагает точного равенства, называемого свойством Архимеда . [4] В нем говорится, что любое разделение предпочтений может поддерживаться при достаточно малом отклонении вероятностей:

Аксиома 3 ′ (свойство Архимеда): Если , то существует вероятность такая, что

Необходимо принять только одно из (3) или (3 ′), а другое будет подразумеваться теоремой.

Независимость нерелевантных альтернатив предполагает, что предпочтение сохраняется независимо от возможности другого результата:

Аксиома 4 (Независимость): Для любого и ,

Из аксиомы независимости следует аксиома о сокращении составных лотерей: [6]

Аксиома 4 ′ (Уменьшение составных лотерей): Для любых лотерей и любых ,

Чтобы увидеть, как из аксиомы 4 следует аксиома 4 ', задайте выражение в аксиоме 4 и разверните.

Теорема [ править ]

Для любого VNM-рационального агента (т.е. удовлетворяющего аксиомам 1–4) существует функция u, которая присваивает каждому результату A действительное число u (A) такое, что для любых двух лотерей

где E (u (L)) , или, короче, Eu ( L ) задается формулой

Таким образом, u может быть однозначно определено (вплоть до добавления константы и умножения на положительный скаляр) предпочтениями между простыми лотереями , то есть лотереями формы pA  + (1 -  p ) B, имеющими только два результата. И наоборот, любой агент, действующий, чтобы максимизировать математическое ожидание функции u, будет подчиняться аксиомам 1–4. Такая функция называется утилитой агента фон Неймана – Моргенштерна (VNM) .

Доказательство [ править ]

Доказательство конструктивно: оно показывает, как можно построить искомую функцию . Здесь мы опишем процесс построения для случая, когда число надежных исходов конечно. [7] : 132–134

Предположим , что существует п уверены , результаты, . Обратите внимание, что каждый гарантированный результат можно рассматривать как лотерею: это вырожденная лотерея, в которой исход выбирается с вероятностью 1. Следовательно, согласно аксиомам полноты и транзитивности можно упорядочить исходы от худшего к лучшему:

Мы предполагаем, что хотя бы одно из неравенств является строгим (в противном случае функция полезности тривиальна - постоянна). Итак . Мы используем эти два крайних результата - худший и лучший - в качестве единицы масштабирования нашей функции полезности и определяем:

а также

Для каждой вероятности определите лотерею, которая выбирает лучший результат с вероятностью и худший результат в противном случае:

Обратите внимание, что и .

Согласно аксиоме непрерывности, для каждого гарантированного исхода существует такая вероятность , что:

а также

Для каждого функция полезности результата определяется как

поэтому полезность каждой лотереи является ожидание U :

Чтобы понять, почему эта функция полезности имеет смысл, рассмотрим лотерею , которая выбирает результат с вероятностью . Но, по нашему предположению, лицо, принимающее решение, безразлично между уверенным исходом и розыгрышем лотереи . Итак, по аксиоме редукции, ему безразлична лотерея и следующая лотерея:

По сути, лотерея - это лотерея, в которой с вероятностью выигрывается лучший результат , а в противном случае - худший.

Следовательно, если человек , принимающий рациональные решения, предпочтет лотерею лотерее , потому что это дает ему больше шансов выиграть лучший результат.

Следовательно:

если и только если

Реакция [ править ]

Фон Нейман и Моргенштерн ожидали удивления силой своего заключения. Но, по их словам, их функция полезности работает потому, что она построена именно для того, чтобы исполнять роль чего-то, чьи ожидания максимальны:

«Многие экономисты почувствуют, что мы слишком много предполагаем ... Разве мы не показали слишком много? ... Насколько мы можем видеть, наши постулаты [являются] правдоподобными ... Мы практически определили числовую полезность как то, что вещь, для которой обоснован расчет математических ожиданий ". - ВНМ 1953, § 3.1.1 п.16 и § 3.7.1 п. 28 [1]

Таким образом, содержание теоремы состоит в том, что построение u возможно, и они мало что говорят о его природе.

Последствия [ править ]

Автоматическое рассмотрение избегания риска [ править ]

Часто бывает, что человек, столкнувшийся с реальными азартными играми с деньгами, не пытается максимизировать ожидаемую стоимость своих долларовых активов. Например, человек, у которого есть сбережения всего в 1000 долларов, может не захотеть рискнуть всем ради 20% шансов выиграть 10000 долларов, даже если

Однако, если человек является VNM-рациональным, такие факты автоматически учитываются в его функции полезности u . В этом примере мы могли бы сделать вывод, что

где суммы в долларах здесь действительно представляют собой результаты (ср. « ценность »), три возможных ситуации, с которыми может столкнуться человек. В частности, u может проявлять свойства типа u ($ 1) + u ($ 1) ≠ u ($ 2), вообще не противореча VNM-рациональности. Это приводит к количественной теории неприятия монетарного риска.

Последствия для гипотезы ожидаемой полезности [ править ]

В 1738 году Даниэль Бернулли опубликовал трактат [8], в котором он утверждает, что рациональное поведение можно описать как максимизацию ожидания функции u , которая, в частности, не обязательно должна быть оценена в денежном выражении, что объясняет уклонение от риска. Это гипотеза ожидаемой полезности . Как уже было сказано, эта гипотеза может показаться смелой. Цель теоремы об ожидаемой полезности - предоставить «скромные условия» (т. Е. Аксиомы), описывающие, когда выполняется гипотеза ожидаемой полезности, которые можно оценить напрямую и интуитивно:

«Аксиом не должно быть слишком много, их система должна быть как можно более простой и прозрачной, и каждая аксиома должна иметь непосредственное интуитивное значение, по которому можно напрямую судить о ее уместности. В такой ситуации, как наша, это последнее требование особенно важно. , несмотря на его расплывчатость: мы хотим сделать интуитивную концепцию доступной для математической обработки и увидеть как можно яснее, какие гипотезы для этого требуются ». - ВНМ 1953 § 3.5.2, с. 25 [1]

Таким образом, утверждения о том, что гипотеза ожидаемой полезности не характеризует рациональность, должны отвергать одну из аксиом VNM. Возникло множество обобщенных теорий ожидаемой полезности , большинство из которых отбрасывают или ослабляют аксиому независимости.

Значение для этики и моральной философии [ править ]

Поскольку теорема ничего не предполагает о природе возможных исходов азартных игр, они могут быть морально значимыми событиями, например, связанными с жизнью, смертью, болезнью или здоровьем других. Рациональный агент фон Неймана-Моргенштерна способен действовать с большой заботой о таких событиях, жертвуя большим личным богатством или благополучием, и все эти действия будут влиять на построение / определение функции VNM-полезности агента. Другими словами, как то, что естественно воспринимается как «личная выгода», так и то, что естественно воспринимается как «альтруизм», неявно сбалансированы в функции полезности VNM рационального индивида. Следовательно, полный спектр ориентированного на агента поведения, не зависящего от агента , возможен с помощью различных служебных функций VNM [требуется разъяснение ].

Если полезность есть , рациональный агент фон Неймана-Моргенштерна должен быть безразличен между и . Следовательно, рациональный агент фон Неймана-Моргенштерна, ориентированный на агента, не может поддерживать более равное или «справедливое» распределение полезности между его собственными возможными будущими «я».

Отличие от других понятий полезности [ править ]

Некоторые утилитарные моральные теории касаются величин, называемых «общей полезностью» и «средней полезностью» коллективов, и характеризуют мораль с точки зрения одобрения полезности или счастья других при игнорировании собственного. Эти понятия могут быть связаны с VNM-утилитой, но отличны от нее:

  • 1) VNM-полезность - это полезность принятия решений : [3] это то, на основании чего человек принимает решение, и, следовательно, по определению не может быть чем-то, что можно игнорировать.
  • 2) VNM-полезность не является канонически аддитивной для нескольких индивидуумов (см. Ограничения), поэтому «общая VNM-полезность» и «средняя VNM-полезность» не имеют непосредственного значения (требуется какое-то предположение о нормализации).

Термин E-утилита для «опыта полезности» была придумана [3] для обозначения типов «гедонистической» полезность , как у Бентама «s наибольший принцип счастья . Поскольку мораль влияет на решения, мораль VNM-рационального агента будет влиять на определение его собственной функции полезности (см. Выше). Таким образом, мораль VNM-рационального агента может быть охарактеризована корреляцией VNM-полезности агента с VNM-полезностью, E-полезностью или «счастьем» других, среди прочего, но не игнорированием собственного VNM-утилита, противоречие в терминах.

Ограничения [ править ]

Вложенные азартные игры [ править ]

Поскольку если L и M являются лотереями, то pL  + (1 -  p ) M просто «расширяется» и считается самой лотереей, формализм VNM игнорирует то, что может восприниматься как «вложенная игра». Это связано с проблемой Эллсберга, когда люди предпочитают избегать восприятия рисков относительно рисков . Фон Нейман и Моргенштерн признали это ограничение:

«... такие концепции, как особая полезность азартных игр, не могут быть сформулированы без противоречий на этом уровне. Это может показаться парадоксальным утверждением. Но любой, кто серьезно пытался аксиоматизировать эту неуловимую концепцию, вероятно, согласится с ней». - ВНМ 1953 § 3.7.1, с. 28 . [1]

Несопоставимость агентов [ править ]

Поскольку для любых двух VNM-агентов X и Y их функции VNM-полезности u X и u Y определены только с точностью до аддитивных констант и мультипликативных положительных скаляров, теорема не предоставляет никакого канонического способа сравнения этих двух. Следовательно, выражения типа u X ( L ) + u Y ( L ) и u X ( L ) -  u Y ( L ) не определены канонически, равно как и сравнения типа u X ( L ) <  u Y (L ) канонически истинное или ложное. В частности, вышеупомянутые «общая VNM-полезность» и «средняя VNM-полезность» популяции не могут быть канонически значимыми без предположений о нормализации.

Применимость к экономике [ править ]

Показано, что гипотеза ожидаемой полезности имеет ограниченную точность прогнозов в ряде лабораторных эмпирических экспериментов, таких как парадокс Алле . Это заставляет некоторых людей интерпретировать как свидетельство того, что

  • люди не всегда рациональны, или
  • VNM-рациональность не является подходящей характеристикой рациональности, или
  • некоторая комбинация того и другого, или
  • люди действительно ведут себя VNM-рационально, но объективная оценка u и построение u - неразрешимые проблемы.

Ссылки и дополнительная литература [ править ]

  1. ^ a b c d Нойман, Джон фон и Моргенштерн, Оскар , Теория игр и экономического поведения . Принстон, штат Нью-Джерси. Издательство Принстонского университета, 1953.
  2. Петерсон, Глава 8.
  3. ^ a b c Канеман; Ваккер; Зарин (1997). «Назад к Бентам? Исследования опытной полезности» . Ежеквартальный экономический журнал . 112 (2): 375–406. DOI : 10.1162 / 003355397555235 . hdl : 1765/23011 .
  4. ^ a b Крепс, Дэвид М. Заметки по теории выбора . Westview Press (12 мая 1988 г.), главы 2 и 5.
  5. ^ При обозначении безразличия равенством подразумеваются такие утверждения, как если,то. Чтобы сделать такие отношения явными в аксиомах, Kreps (1988), глава 2 обозначает безразличие, так что его можно кратко рассмотреть на предмет интуитивного значения.
  6. ^ EconPort, "Теория ожидаемой полезности фон Неймана – Моргенштерна" http://www.econport.org/content/handbook/decisions-uncretety/basic/von.html
  7. ^ Кини, Ральф Л .; Райффа, Ховард (1993). Решения с несколькими целями . ISBN 0-521-44185-4.
  8. ^ Образцы theoriae novae de mensura sortis или изложение новой теории измерения риска
  • Нэш, Джон Ф. младший (1950). «Проблема торга». Econometrica . 18 (2): 155–162. DOI : 10.2307 / 1907266 . JSTOR  1907266 . CS1 maint: discouraged parameter (link)
  • Ананд, Пол. Основы рационального выбора в условиях риска Oxford, Oxford University Press. 1993 переиздано 1995, 2002
  • Фишберн, Питер С. Теория полезности для принятия решений . Хантингтон, штат Нью-Йорк. Роберт Э. Кригер Publishing Co. 1970. ISBN 978-0-471-26060-8 
  • Сиксто Риос (1998) Некоторые проблемы и достижения в науке о принятии решений , Revista Matematica Complutense 11 (1): 113–41.
  • Петерсон, Мартин (2009). Введение в теорию принятия решений (Кембриджские введения в философию) . Кембридж: Издательство Кембриджского университета.