Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Преобладание риска и выигрыша доминирование два связанных рафинирования в равновесие Нэша (NE) концепции решения в теории игр , определяемой Харсаньи и Зелтен . Равновесие по Нэшу считается доминирующим по выигрышу, если оно по Парето превосходит все другие равновесия по Нэшу в игре. 1 Столкнувшись с выбором между равновесиями, все игроки согласятся с преобладающим равновесием выплат, поскольку оно предлагает каждому игроку, по крайней мере, такой же выигрыш, как и другие равновесия Нэша. И наоборот, равновесие по Нэшу считается доминирующим по риску, если оно имеет наибольшуюбассейн притяжения (т.е. менее рискованный). Это означает, что чем больше у игроков неуверенности в действиях другого игрока (ов), тем больше вероятность, что они выберут соответствующую ему стратегию.

Матрица выигрышей на рисунке 1 представлен простой пример двух игроков, две стратегии игры с двумя чистыми равновесий Нэша. Пара стратегий (Охота, Охота) является доминирующей по выплате, поскольку выплаты выше для обоих игроков по сравнению с другим чистым NE (Собрать, Собрать). С другой стороны, риск (Собрать, Собрать) доминирует (Охота, Охота), поскольку, если существует неопределенность в отношении действий другого игрока, сбор обеспечит более высокий ожидаемый выигрыш. Игра на рисунке 1 - это хорошо известная теоретико-игровая дилемма, называемая охотой на оленей.. Обоснование этого состоит в том, что совместные действия (охота) дают более высокую отдачу, если все игроки объединяют свои навыки, но если неизвестно, помогает ли другой игрок в охоте, сбор может оказаться лучшей индивидуальной стратегией для обеспечения еды, поскольку это не зависит от координации с другим игроком. Кроме того, собирание в одиночку предпочтительнее, чем соревнование с другими. Подобно дилемме заключенного , он дает причину, по которой коллективные действия могут потерпеть неудачу при отсутствии надежных обязательств .

Формальное определение [ править ]

Игра, представленная на рисунке 2, является координационной, если для игрока 1 (строки) выполняются следующие неравенства выплат: A> B, D> C, и для игрока 2 (столбцы): a> b, d> c. Тогда пары стратегий (H, H) и (G, G) являются единственными чистыми равновесиями по Нэшу. Кроме того, существует смешанное равновесие по Нэшу, когда игрок 1 играет H с вероятностью p = (dc) / (ab-c + d) и G с вероятностью 1 – p; игрок 2 играет H с вероятностью q = (DC) / (AB-C + D) и G с вероятностью 1 – q.

Выигрыш пары стратегий (H, H) доминирует над (G, G), если A ≥ D, a ≥ d и хотя бы одно из двух является строгим неравенством: A> D или a> d.

Риск пары стратегий (G, G) доминирует (H, H), если продукт потерь от отклонения является самым высоким для (G, G) (Harsanyi and Selten, 1988, лемма 5.4.4). Другими словами, если выполняется следующее неравенство: (C - D) (c - d) ≥ (B - A) (b - a) . Если неравенство строгое, то (G, G) строго доминирует риск (H, H). 2 (То есть у игроков больше стимулов отклоняться).

Если игра симметрична, то есть если A = a, B = b и т. Д., Неравенство допускает простую интерпретацию: мы предполагаем, что игроки не уверены в том, какую стратегию выберет противник, и назначают вероятности для каждой стратегии. Если каждый игрок присваивает вероятности ½ H и G каждому, то (G, G) риск преобладает (H, H), если ожидаемый выигрыш от игры G превышает ожидаемый выигрыш от игры H: ½ B + ½ D ≥ ½ A + ½ С , или просто B + D ≥ А + С .

Другой способ рассчитать равновесие с преобладанием риска - это вычислить фактор риска для всех равновесий и найти равновесие с наименьшим фактором риска. Чтобы вычислить фактор риска в нашей игре 2x2, рассмотрите ожидаемую выплату игроку, если он сыграет H: (где p - вероятность того, что другой игрок сыграет H), и сравните ее с ожидаемой выплатой, если он сыграет G : . Значение p, которое уравнивает эти два ожидаемых значения, является фактором риска для равновесия (H, H) с фактором риска для игры (G, G). Вы также можете рассчитать фактор риска для игры (G, G), выполнив тот же расчет, но установив p как вероятность того, что другой игрок сыграет G. Интерпретация для p это наименьшая вероятность того, что противник должен разыграть эту стратегию, так что собственный выигрыш человека от копирования стратегии оппонента будет больше, чем если бы использовалась другая стратегия.

Выбор равновесия [ править ]

С помощью ряда эволюционных подходов было установлено, что при игре в большой популяции игроки могут не разыграть стратегию равновесия с преобладанием выплаты и вместо этого прийти к равновесию с преобладанием выплаты и с преобладанием риска. Две отдельные эволюционные модели поддерживают идею о том, что равновесие с преобладанием риска более вероятно. Первая модель, основанная на динамике репликатора , предсказывает, что популяция с большей вероятностью примет равновесие с преобладанием риска, чем равновесие с преобладанием выплат. Вторая модель, основанная на пересмотре стратегии наилучшего реагирования и мутации , предсказывает, что состояние с доминированием риска является единственным стохастически стабильнымравновесие. Обе модели предполагают, что в несколько игр для двух игроков играют N игроков. Игроки подбираются случайным образом с противниками, причем у каждого игрока есть равная вероятность вытащить любой из N − 1 других игроков. Игроки начинают с чистой стратегии, G или H, и используют эту стратегию против своего оппонента. В динамике репликатора популяционная игра повторяется в последовательных поколениях, где субпопуляции меняются в зависимости от успеха выбранных ими стратегий. В лучшем случае игроки обновляют свои стратегии, чтобы улучшить ожидаемые выплаты в последующих поколениях. Кандори, Майлат и Роб (1993) и Янг (1993) признали, что если правило обновления стратегии допускает мутацию 4, и вероятность мутации равна нулю, т. е. асимптотически достигает нуля с течением времени, вероятность достижения равновесия с преобладанием риска стремится к единице, даже если в этом случае преобладает выигрыш. 3

Заметки [ править ]

  • ^ 1 Одно равновесие по Нэшу является тривиальным преимуществом выигрыша и риска, если оно является единственным NE в игре.
  • ^ 2 Подобные различия между строгим и слабым существуют для большинства определений здесь, но не указываются явно, за исключением случаев необходимости.
  • ^ 3 Харсани и Селтен (1988) предполагают, что равновесие с доминированием выигрыша является рациональным выбором в игре по охоте на оленей, однако Харсани (1995) отказался от этого вывода, приняв доминирование риска в качестве соответствующего критерия выбора.

Ссылки [ править ]

  • Сэмюэл Боулз: Микроэкономика: поведение, институты и эволюция , Princeton University Press, стр. 45–46 (2004) ISBN  0-691-09163-3
  • Дрю Фуденберг и Дэвид К. Левин: Теория обучения в играх , MIT Press, стр. 27 (1999) ISBN 0-262-06194-5 
  • Джон К. Харсани: «Новая теория выбора равновесия для игр с полной информацией», Игры и экономическое поведение 8, стр. 91–122 (1995).
  • Джон К. Харсани и Рейнхард Селтен: общая теория равновесного выбора в играх , MIT Press (1988) ISBN 0-262-08173-3 
  • Michihiro Kandori , Джордж Дж Mailath и Рафаэль Rob : «Обучение, Мутация, и долгосрочные Равновесия в играх», Эконометрика . 61, стр 29-56 (1993) Аннотация
  • Роджер Б. Майерсон: теория игр, анализ конфликта , издательство Гарвардского университета, стр. 118–119 (1991) ISBN 0-674-34115-5 
  • Ларри Самуэльсон : эволюционные игры и выбор равновесия , MIT Press (1997) ISBN 0-262-19382-5 
  • H. Пейтон Янг: "Эволюция конвенций", Эконометрика ., 61, стр 57-84 (1993) Аннотация
  • Х. Пейтон Янг: индивидуальная стратегия и социальная структура , Princeton University Press (1998) ISBN 0-691-08687-7