Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В теории игр , то теорема очистки была внесена нобелевским лауреат Джон Harsanyi в 1973 г. [1] теорема целей , чтобы оправдать загадочный аспект смешанной стратегии Nash равновесий : что каждый игрок полностью равнодушен среди каждого из действий , которые он ставит ненулевой на весу, но он смешивает их так, чтобы всем остальным игрокам было безразлично.

Равновесия смешанной стратегии объясняются как предел равновесия чистой стратегии для нарушенной игры с неполной информацией, в которой выигрыши каждого игрока известны им самим, но не их оппонентам. Идея состоит в том, что предсказанная смешанная стратегия исходной игры возникает как постоянно улучшающее приближение игры, что не наблюдается теоретиком, создавшим оригинальную идеализированную игру.

Очевидно смешанный характер стратегии на самом деле является просто результатом того, что каждый игрок играет чистую стратегию с пороговыми значениями, которые зависят от ожидаемого распределения по континууму выплат, которые может получить игрок. По мере того, как этот континуум сжимается до нуля, стратегии игроков сходятся к предсказанным равновесиям Нэша исходной, невозмущенной, полной информационной игры.

Результат также является важным аспектом современных исследований в эволюционной теории игр, где возмущенные значения интерпретируются как распределения по типам игроков, случайным образом объединяемых в пары для игры в игры.

Пример [ править ]

Рассмотрим игру Ястреб-Голубь, показанную здесь. В игре есть два чистых стратегических равновесия (Дефект, Сотрудничество) и (Сотрудничество, Дефект). Он также имеет смешанное равновесие, в котором каждый игрок играет Кооператив с вероятностью 2/3.

Предположим, что каждый игрок i несет дополнительную плату a i за участие в совместной игре, которая равномерно распределяется на [- AA ]. Игроки знают только свою собственную стоимость этой стоимости. Итак, это игра с неполной информацией, которую мы можем решить, используя байесовское равновесие по Нэшу . Вероятность того, что яа * есть ( а * + ) / 2 . Если игрок 2 сотрудничает, когда a 2a * , то ожидаемая полезность игрока 1 от сотрудничества составляет - a 1 + 3 (а * + А ) / 2 А + 2 (1 - ( а * + А ) / 2 А ) ; его ожидаемая полезность от побега является 4 ( а * + ) / 2 . Он должен поэтому сам Сотрудничать когда на 1 ≤ 2 - 3 ( а * + А ) / 2 A . В поисках симметричного равновесия, при котором оба игрока взаимодействуют, если a ia * , мы решаем это для a * = 1 / (2 + 3 / A ). Теперь мы разработали *, мы можем вычислить вероятность того, что каждый игрок будет играть в Cooperate, как

При A → 0 это приближается к 2/3 - такая же вероятность, как и в смешанной стратегии в игре с полной информацией.

Таким образом, мы можем рассматривать равновесие смешанной стратегии как результат чистых стратегий, которым следуют игроки, у которых есть небольшой объем частной информации о своих выигрышах.

Технические детали [ править ]

Доказательство Харшаньи включает сильное предположение, что возмущения для каждого игрока не зависят от других игроков. Однако были предприняты попытки дальнейших уточнений, чтобы сделать теорему более общей. [2] [3]

Главный результат теоремы состоит в том, что все равновесия смешанных стратегий данной игры могут быть очищены с помощью одной и той же последовательности нарушенных игр. Однако, помимо независимости от возмущений, он полагается на то, что набор выплат для этой последовательности игр имеет полную меру. Есть игры патологического характера, для которых это условие не выполняется.

Основная проблема с этими играми относится к одной из двух категорий: (1) различные смешанные стратегии игры очищаются различными последовательностями возмущенных игр и (2) некоторые смешанные стратегии игры включают стратегии со слабым доминированием. Никакая смешанная стратегия, включающая стратегию со слабым доминированием, не может быть очищена с помощью этого метода, потому что, если когда-либо существует какая-либо неотрицательная вероятность того, что противник будет играть стратегию, для которой стратегия со слабым доминированием не является лучшим ответом, тогда никто никогда не захочет играть стратегия со слабым доминированием. Следовательно, предел не выполняется, потому что он включает разрыв. [4]

Ссылки [ править ]

  1. ^ JC Harsanyi. 1973. «Игры со случайно нарушенными выплатами: новое обоснование для точек равновесия смешанной стратегии. Int. J. Game Theory 2 (1973), стр. 1-23. Doi : 10.1007 / BF01737554
  2. ^ Р. Ауманн и др. 1983. "Приближенное очищение смешанных стратегий. Математика исследования операций 8 (1983), стр. 327–341.
  3. ^ . Говиндан, S., Рени, PJ и Robson, AJ 2003 «Короткое доказательство Harsányi в Очистка теоремы Игры и экономическое поведение 45 (2) (2003), стр 369-374.. Дои : 10.1016 / S0899-8256 ( 03) 00149-0
  4. ^ Фуденберг, Дрю и Жан Тироль: теория игр , MIT Press, 1991, стр. 233–234