Стратегия (теория игр)

В теории игр , более описательно известной как «теория интерактивных решений», стратегия игрока - это любой из вариантов, которые он или она выбирает в обстановке, где результат зависит не только от их собственных действий, но и от действий других. ^[1] Дисциплина в основном касается действий игрока в игре, влияющих на поведение или действия других игроков. Некоторые примеры «игр» включают шахматы, бридж, покер, монополию, дипломатию или боевой корабль. ^[2]Стратегия игрока будет определять действие, которое игрок будет предпринимать на любом этапе игры. Изучая теорию игр, экономисты используют более рациональную линзу при анализе решений, а не психологические или социологические точки зрения, принимаемые при анализе отношений между решениями двух или более сторон в разных дисциплинах.

Концепцию стратегии иногда (ошибочно) путают с концепцией хода . Шаг мера , принятый игроком в каком - то момент во время игры игры (например, в шахматах, двигающийся белый Епископ А2 b3). С другой стороны, стратегия - это полный алгоритм ведения игры, говорящий игроку, что делать в каждой возможной ситуации на протяжении всей игры. Полезно думать о «стратегии» как о списке направлений, а о «движении» - как об одном повороте самого списка направлений.

Профиль стратегии (иногда называется сочетанием стратегии ) представляет собой набор стратегий для всех игроков , которые полностью определяют все действия в игре. Профиль стратегии должен включать одну и только одну стратегию для каждого игрока, чтобы наилучшим и наиболее рациональным образом реагировать на решения, принимаемые другими игроками.

Набор стратегий [ править ]

Набор стратегий игрока определяет, какие стратегии доступны для игры. Профиль стратегии - это список наборов стратегий, отсортированных от наиболее к наименее желательным.

У игрока есть конечный набор стратегий, если ему доступно несколько дискретных стратегий. Например, игра « камень-ножницы-бумага» состоит из одного хода каждого игрока - и каждый игрок совершает ход без ведома другого, а не в качестве реакции, - так что у каждого игрока есть конечный набор стратегий {камень-ножницы-бумага}.

В противном случае набор стратегий бесконечен. Например, игра по резке торта имеет ограниченный континуум стратегий в наборе стратегии {Вырезать где-нибудь между 0 и 100 процентами торта}.

В динамической игре , играх, в которые играют в течение определенного периода времени, набор стратегий состоит из возможных правил, которые игрок может дать роботу или агенту о том, как играть в игру. Например, в игре ультиматум стратегия, установленная для второго игрока, будет состоять из всех возможных правил, для которых предложения принимать, а какие отклонять.

В байесовской игре или играх, в которых игроки имеют неполную информацию друг о друге, набор стратегий аналогичен таковому в динамической игре. Он состоит из правил, которые следует предпринять в отношении любой возможной личной информации.

Выбор набора стратегий [ править ]

В прикладной теории игр определение наборов стратегий является важной частью искусства сделать игру одновременно решаемой и содержательной. Теоретик игр может использовать знание общей проблемы, то есть трений между двумя или более игроками, чтобы ограничить пространство стратегий и облегчить решение.

Например, строго говоря, в игре Ultimatum у игрока могут быть такие стратегии, как: отклонять предложения на сумму (1, 3, 5, ..., 19 долларов), принимать предложения на сумму (0, 2, 4, ..., 20 долларов). . Включение всех таких стратегий приводит к очень большому пространству стратегий и довольно сложной проблеме. Вместо этого теоретик игры может полагать, что он может ограничить набор стратегии следующим образом: {отклонить любое предложение ≤ x , принять любое предложение> x ; для x в ($ 0, $ 1, $ 2, ..., $ 20)}.

Чистые и смешанные стратегии [ править ]

Чистая стратегия обеспечивает полное определение того , как игрок будет играть в игру. Чистую стратегию можно рассматривать как план, зависящий от наблюдений, которые он делает в ходе игры. В частности, он определяет ход, который сделает игрок в любой ситуации, с которой он может столкнуться. Набор стратегий игрока - это набор чистых стратегий, доступных этому игроку.

Смешанная стратегия является присвоением вероятности каждой чистой стратегии. Использование смешанной стратегии часто происходит из-за того, что игра не позволяет рационально описать чистую стратегию игры. Это позволяет игроку случайным образом выбирать чистую стратегию. (См. Иллюстрацию в следующем разделе.) Поскольку вероятности непрерывны, игроку доступно бесконечно много смешанных стратегий. Поскольку вероятности назначаются стратегиям для конкретного игрока при обсуждении выигрышей в определенных сценариях, выигрыш должен называться «ожидаемым выигрышем».

Конечно, можно рассматривать чистую стратегию как вырожденный случай смешанной стратегии, в которой эта конкретная чистая стратегия выбирается с вероятностью 1, а любая другая стратегия - с вероятностью 0 .

Полностью смешанная стратегия является смешанной стратегией , в которой игрок назначает строго положительную вероятность для каждой чистой стратегии. (Полностью смешанные стратегии важны для улучшения равновесия, такого как идеальное равновесие дрожащей рукой .)

Смешанная стратегия [ править ]

Иллюстрация [ править ]

При футбольном пенальти игрок, выполняющий удар, должен выбрать, ударить ли его справа или слева от ворот, и одновременно вратарь должен решить, каким образом его заблокировать. Кроме того, у кикера есть направление, в котором он лучше всего стреляет, - левое, если он правосторонний. Матрица футбольного матча иллюстрирует эту ситуацию, упрощенную форму игры, изученную Чиаппори, Левиттом и Гросеклоузом (2002). ^[3] Предполагается, что, если вратарь угадает правильно, удар блокируется, что соответствует базовой выплате 0 для обоих игроков. Если вратарь ошибается, вероятность того, что удар будет нанесен слева (выигрыш +2 для бьющего игрока и -2 для вратаря), будет выше, чем если он будет нанесен вправо (нижний результат +1 к кикер и -1 вратарю).

		Вратарь
		Наклонитесь влево	Наклонитесь вправо
Кикер	Удар влево	0, 0	+2, -2
	Удар вправо	+1, -1	0, 0


Расплата за футбольный матч (кикер, вратарь)

В этой игре нет чистого стратегического равновесия, потому что тот или иной игрок отклонялся бы от любого профиля стратегии - например, (Влево, Влево) не является равновесием, потому что Кикер отклонится вправо и увеличит свой выигрыш с 0 до 1.

Равновесие смешанной стратегии кикера определяется тем фактом, что он будет отклоняться от рандомизации, если только его выигрыши от левого и правого ударов точно не равны. Если вратарь наклоняется влево с вероятностью g, ожидаемый выигрыш бьющего при ударе влево будет g (0) + (1-g) (2), а при ударе справа - g (1) + (1-g) (0). Приравнивая эти результаты, получаем g = 2/3. Точно так же вратарь желает рандомизировать только в том случае, если бьющий игрок выбирает смешанную стратегию с вероятностью k так, что выигрыш в размере k (0) + (1-k) (- 1) Lean Left равен выигрышу Lean Right, равному k (-2) + (1 -k) (0), поэтому k = 1/3. Таким образом, равновесие смешанной стратегии имеет вид (Prob (Kick Left) = 1/3, (Prob (Lean Left) = 2/3).

Обратите внимание, что в состоянии равновесия кикер наносит удар в лучшую сторону только в 1/3 случаев. Это потому, что вратарь больше защищает ту сторону. Также обратите внимание, что в равновесии кикеру безразлично, в какую сторону он пинает, но для того, чтобы это было равновесие, он должен выбрать ровно 1/3 вероятности.

Чиаппори, Левитт и Гросеклоуз пытаются измерить, насколько важно для кикера выполнить удар в сторону его любимой стороны, добавить удары по центру и т. Д., И посмотреть, как на самом деле ведут себя профессиональные игроки. Они обнаруживают, что они рандомизированы, и что кикеры бьют в свою сторону в 45% случаев, а вратари наклоняются в эту сторону в 57% случаев. Их статья хорошо известна как пример того, как люди в реальной жизни используют смешанные стратегии, несмотря на то, что они не обладают математической сложностью.

Значение [ править ]

В своей знаменитой статье Джон Форбс Нэш доказал, что равновесие существует для любой конечной игры. Равновесия по Нэшу можно разделить на два типа. Чистая стратегия Равновесия по Нэшу - это равновесия по Нэшу, в которых все игроки играют в чистые стратегии. Смешанная стратегия Равновесия по Нэшу - это равновесия, при которых хотя бы один игрок играет смешанную стратегию. Хотя Нэш доказал, что каждая конечная игра имеет равновесие по Нэшу, не все имеют равновесие по Нэшу чистой стратегии. Для примера игры, в которой нет равновесия по Нэшу в чистых стратегиях, см. Сопоставление пенсов . Однако во многих играх есть чисто стратегическое равновесие по Нэшу (например, игра «Координация» , «дилемма заключенного»)., Охота на оленя ). Кроме того, игры могут иметь как чистую стратегию, так и равновесие смешанной стратегии. Простым примером является чисто координационная игра, где в дополнение к чистым стратегиям (A, A) и (B, B) существует смешанное равновесие, в котором оба игрока играют любую стратегию с вероятностью 1/2.

Интерпретации смешанных стратегий [ править ]

В 80-е годы концепция смешанных стратегий подверглась резкой критике за то, что они «интуитивно проблематичны», поскольку они представляют собой слабые равновесия по Нэшу, и игроку безразлично, следует ли ему следовать вероятности своей стратегии равновесия или отклоняться в сторону какой-либо другой вероятности. ^[4] ^[5] теоретик игр Ариэль Рубинштейн описывает альтернативные способы понимания этой концепции. Первый, предложенный Харсаньи (1973), ^[6] , называется очищением и предполагает, что интерпретация смешанных стратегий просто отражает наше незнание информации игроков и процесса принятия решений. Очевидно, случайный выбор тогда рассматривается как следствие неуказанных, нерелевантных экзогенных факторов. ^[5]Вторая интерпретация предполагает, что игроки выступают за большую группу агентов. Каждый из агентов выбирает чистую стратегию, и выигрыш зависит от доли агентов, выбирающих каждую стратегию. Таким образом, смешанная стратегия представляет собой распределение чистых стратегий, выбранных каждой популяцией. Однако это не дает никаких оснований для случая, когда игроки являются отдельными агентами.

Позже Ауман и Бранденбургер (1995), ^[7] переосмыслили равновесие по Нэшу как равновесие убеждений , а не действий. Например, в « каменных ножницах» равновесие убеждений заставит каждого игрока поверить в то, что другой с равной вероятностью будет использовать каждую стратегию. Однако такая интерпретация ослабляет описательную силу равновесия по Нэшу, поскольку в таком равновесии каждый игрок может фактически разыграть чистую стратегию Рока в каждом процессе игры, даже если со временем вероятности будут равны смешанной стратегии. .

Стратегия поведения [ править ]

В то время как смешанная стратегия назначает распределение вероятностей чистым стратегиям, стратегия поведения назначает каждому информационному набору распределение вероятностей для набора возможных действий. Хотя эти две концепции очень тесно связаны в контексте игр с нормальной формой, они имеют очень разные значения для игр с расширенной формой. Грубо говоря, смешанная стратегия случайным образом выбирает детерминированный путь через дерево игры, в то время как стратегия поведения может рассматриваться как стохастический путь.

Взаимосвязь между смешанными и поведенческими стратегиями является предметом теоремы Куна , поведенческого взгляда на традиционные теоретико-игровые гипотезы. Результат устанавливает, что в любой конечной игре расширенной формы с точным воспроизведением для любого игрока и любой смешанной стратегии существует стратегия поведения, которая против всех профилей стратегий (других игроков) индуцирует такое же распределение по конечным узлам, что и смешанная стратегия делает. Обратное также верно.

Знаменитый пример того, почему для эквивалентности требуется точное воспоминание, был дан Пиччоне и Рубинштейном (1997) ^{[ требуется полная ссылка ] в} их игре « Рассеянный водитель» .

См. Также [ править ]

равновесие по Нэшу
Хейвен (теория графов)
Эволюционно устойчивая стратегия

Ссылки [ править ]

↑ Бен Полак Теория игр: Стенограмма лекции 1 ECON 159, 5 сентября 2007 г., Открытые курсы Йельского университета .
^ Aumann, R. (22 марта 2017). Теория игры. В: Пэлгрейв Макмиллан . Лондон: Пэлгрейв Макмиллан. ISBN 978-1-349-95121-5.
^ Чиаппори, П. -А .; Levitt, S .; Гросеклоуз Т. (2002). «Проверка равновесия смешанной стратегии, когда игроки неоднородны: случай штрафных ударов в футболе» (PDF) . Американский экономический обзор . 92 (4): 1138. CiteSeerX 10.1.1.178.1646 . DOI : 10.1257 / 00028280260344678 .
^ Aumann, R. (1985). «Чего пытается достичь теория игр?» (PDF) . In Arrow, K .; Хонкапохья, С. (ред.). Границы экономики . Оксфорд: Бэзил Блэквелл. С. 909–924.
^ а б Рубинштейн А. (1991). «Комментарии к интерпретации теории игр». Econometrica . 59 (4): 909–924. DOI : 10.2307 / 2938166 . JSTOR 2938166 .
^ Харшани, Джон (1973). «Игры со случайно нарушенными выплатами: новое объяснение для точек равновесия смешанной стратегии». Int. J. Теория игр . 2 : 1–23. DOI : 10.1007 / BF01737554 .
^ Ауманн, Роберт ; Бранденбургер, Адам (1995). «Эпистемические условия равновесия по Нэшу». Econometrica . 63 (5): 1161–1180. CiteSeerX 10.1.1.122.5816 . DOI : 10.2307 / 2171725 . JSTOR 2171725 .

[1] Бен Полак Теория игр: Стенограмма лекции 1 ECON 159, 5 сентября 2007 г., Открытые курсы Йельского университета .

[2] Aumann, R. (22 марта 2017). Теория игры. В: Пэлгрейв Макмиллан . Лондон: Пэлгрейв Макмиллан. ISBN 978-1-349-95121-5.

[3] Чиаппори, П. -А .; Levitt, S .; Гросеклоуз Т. (2002). «Проверка равновесия смешанной стратегии, когда игроки неоднородны: случай штрафных ударов в футболе» (PDF) . Американский экономический обзор . 92 (4): 1138. CiteSeerX 10.1.1.178.1646 . DOI : 10.1257 / 00028280260344678 .

[Aumann1985-4] Aumann, R. (1985). «Чего пытается достичь теория игр?» (PDF) . In Arrow, K .; Хонкапохья, С. (ред.). Границы экономики . Оксфорд: Бэзил Блэквелл. С. 909–924.

[Rubinstein1991-5] а б Рубинштейн А. (1991). «Комментарии к интерпретации теории игр». Econometrica . 59 (4): 909–924. DOI : 10.2307 / 2938166 . JSTOR 2938166 .

[6] Харшани, Джон (1973). «Игры со случайно нарушенными выплатами: новое объяснение для точек равновесия смешанной стратегии». Int. J. Теория игр . 2 : 1–23. DOI : 10.1007 / BF01737554 .

[7] Ауманн, Роберт ; Бранденбургер, Адам (1995). «Эпистемические условия равновесия по Нэшу». Econometrica . 63 (5): 1161–1180. CiteSeerX 10.1.1.122.5816 . DOI : 10.2307 / 2171725 . JSTOR 2171725 .

[1]

vтеТемы по теории игр
Определения	Кооперативная игра Решительность Эскалация обязательств Игра в расширенной форме Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Лаконичная игра
Концепции равновесия	равновесие по Нэшу Совершенство подигры Устойчивое равновесие по Мертенсу Байесовское равновесие по Нэшу Идеальное байесовское равновесие Дрожащая рука Правильное равновесие Эпсилон-равновесие Коррелированное равновесие Последовательное равновесие Квази-совершенное равновесие Эволюционно устойчивая стратегия Доминирование риска Основной Значение Шепли Парето эффективность Равновесие Гиббса Квантовое равновесие отклика Самоподтверждающееся равновесие Сильное равновесие по Нэшу Марковское идеальное равновесие
Стратегии	Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент кражи стратегии Око за око Мрачный спусковой крючок Сговор Обратная индукция Прямая индукция Марковская стратегия Затенение ставки
Классы игр	Симметричная игра Идеальная информация Повторная игра Сигнальная игра Показ игры Дешевый разговор Игра с нулевой суммой Конструкция механизма Проблема торга Стохастическая игра Средняя игра n -игровая игра Большая игра Пуассона Нетранзитивная игра Глобальная игра Строго определенная игра Возможная игра
Игры	Идти Шахматы Бесконечные шахматы Шашки Крестики-нолики Дилемма заключенного Игра по обмену подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица Сороконожка игра Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Камень ножницы Бумага Пиратская игра Диктаторская игра Игра в общественные блага Блотто игра Война на истощение Проблема с баром Эль Фарол Справедливое деление Ярмарка нарезки торта Игра Курно Тупик Дилемма закусочной Угадайте 2/3 среднего Покер куна Игра Нэша в торг Индукционные головоломки Доверительная игра Игра принцесс и монстров Проблема рандеву
Теоремы	Теорема о невозможности Эрроу Теорема согласия Ауманна Народная теорема Теорема о минимаксе Теорема Нэша Теорема очищения Принцип откровения Теорема Цермело
Ключевые цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Даниэль Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Разное	All-pay аукцион Альфа – бета обрезка Парадокс Бертрана Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации Сотрудничество Эволюционная теория игр Преимущество первого хода в шахматах Игровая механика Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыигрышная ситуация Решение шахмат Топологическая игра Трагедия общественного достояния Тирания малых решений