Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В теории игр , rationalizability является концепция решения . Общая идея состоит в том, чтобы обеспечить самые слабые ограничения для игроков, при этом требуя, чтобы игроки были рациональны, и эта рациональность широко известна среди игроков. Это более снисходительно, чем равновесие по Нэшу . Оба требуют, чтобы игроки оптимально реагировали на некоторые убеждения о действиях своих оппонентов, но равновесие по Нэшу требует, чтобы эти убеждения были правильными, а рациональность - нет. Рационализуемость была впервые независимо определена Бернхеймом (1984) и Пирсом (1984).

Определение [ править ]

Для игры в нормальной форме рационализируемый набор действий можно вычислить следующим образом: Начните с полного набора действий для каждого игрока. Затем удалите все действия, которые никогда не являются лучшим ответом на какое-либо мнение о действиях оппонентов - мотивация для этого шага заключается в том, что ни один рациональный игрок не может выбрать такие действия. Затем удалите все действия, которые никогда не являются лучшим ответом на какое-либо мнение об оставшихся действиях оппонентов - этот второй шаг оправдан, потому что каждый игрок знает, что другие игроки рациональны. Продолжайте процесс до тех пор, пока не прекратят никаких дальнейших действий. В игре с конечным числом действий этот процесс всегда завершается и оставляет непустой набор действий для каждого игрока. Это рациональные действия.

Ограничения верований [ править ]

Рассмотрим простую координационную игру ( матрица выигрыша справа). Строка игрок может играть , если он есть основания полагать , что колонок игрок может играть А , так как является лучшим ответом на A . Он может есть основания полагать , что колонок игрок может играть А если это целесообразно для столбца игрока верить , что строка игрок может играть . Она может верить, что он сыграет а, если для нее есть основания полагать, что он может сыграть а и т. Д.

Это обеспечивает бесконечную цепочку последовательных убеждений, которые приводят к тому, что игроки играют ( а , А ). Это делает ( a , A ) рациональной парой действий. Аналогичный процесс можно повторить для ( b , B ).

В качестве примера, когда не все стратегии можно рационализировать, рассмотрим дилемму заключенного, изображенную слева. Игрок строки никогда не будет играть c , так как c - не лучший ответ на любую стратегию игрока столбца. По этой причине c не поддается рационализации.

И наоборот, для игр двух игроков множество всех рационализируемых стратегий может быть найдено путем повторного исключения строго доминируемых стратегий. Однако для того, чтобы этот метод работал, необходимо также учитывать строгое доминирование смешанных стратегий . Рассмотрим игру справа, в которой для простоты опущены выплаты игрока из столбца. Обратите внимание, что «b» не находится под строгим преобладанием ни «t», ни «m» в смысле чистой стратегии, но все же преобладает стратегия, которая смешала бы «t» и «m» с вероятностью каждого, равной 1 / 2. Это связано с тем, что при любом представлении о действиях игрока в столбце смешанная стратегия всегда будет давать более высокий ожидаемый выигрыш. [1] Это означает, что «b» не поддается рационализации.

Более того, «b» - не лучший ответ ни на «L», ни на «R», ни на любое их сочетание. Это связано с тем, что действие, которое невозможно рационализировать, никогда не может быть лучшим ответом на любую стратегию оппонента (чистую или смешанную). Это означало бы другую версию предыдущего метода поиска рационализируемых стратегий, таких как стратегии, которые выживают после повторного исключения стратегий, которые никогда не являются наилучшим ответом (в чистом или смешанном смысле).

Однако в играх с более чем двумя игроками могут быть стратегии, в которых нет строгого доминирования, но которые никогда не могут быть лучшим ответом. Путем повторного исключения всех таких стратегий можно найти рациональные стратегии для многопользовательской игры.

Рационализируемость и равновесие по Нэшу [ править ]

Легко доказать, что любое равновесие по Нэшу является рациональным равновесием; однако обратное неверно. Некоторые рациональные равновесия не являются равновесиями по Нэшу. Это делает концепцию рационализируемости обобщением концепции равновесия по Нэшу.

В качестве примера рассмотрим игру по сопоставлению пенсов, изображенную справа. В этой игре единственное равновесие по Нэшу - это игра по строкам h и t с равной вероятностью и игра по столбцу с H и T с равной вероятностью. Однако все чистые стратегии в этой игре поддаются рационализации.

Рассмотрим следующую аргументацию: строка может играть h, если для нее есть основания полагать, что столбец будет играть h . Столбец может проиграть H, если он разумно полагает, что эта строка сыграет t . Строка может играть т , если это целесообразно для нее верить , что колонка будет играть T . Столбец может сыграть T, если он разумно полагает, что строка будет играть h (начало цикла снова). Это обеспечивает бесконечный набор последовательных убеждений, что приводит к игре h . Аналогичный аргумент можно привести для строки, воспроизводящей t , и для столбца, воспроизводящего либо H, либоT .

См. Также [ править ]

Сноски [ править ]

  1. ^ Гиббонс, Роберт (1992). Учебник по теории игр . С. 32–33.

Ссылки [ править ]

  • Бернхейм, Д. (1984) Рационализируемое стратегическое поведение. Econometrica 52: 1007-1028.
  • Фуденберг, Дрю и Жан Тироль (1993) Теория игр. Кембридж: MIT Press.
  • Пирс, Д. (1984) Рационализируемое стратегическое поведение и проблема совершенства. Econometrica 52: 1029-1050.
  • Рэтклифф, Дж. (1992–1997) конспект лекций по теории игр, §2.2: «Итеративное доминирование и рациональность»