Мрачный спусковой крючок

В теории игр , мрачная триггер (также называемая мрачной стратегия или просто мрачная ) является стратегия запуска для повторной игры.

Первоначально игрок, использующий мрачный триггер, будет сотрудничать, но как только противник откажется (таким образом удовлетворяя условию триггера), игрок, использующий мрачный триггер, откажется от оставшейся части повторяемой игры. Поскольку один-единственный дефект оппонента вызывает отступничество навсегда, мрачный спусковой крючок - самая жесткая из стратегий в повторяющейся игре.

В книге Роберта Аксельрода « Эволюция сотрудничества» мрачный спусковой крючок назван «Фридман» из статьи Джеймса Фридмана 1971 года, в которой используется эта концепция. ^[1]

Бесконечно повторяющаяся дилемма заключенных [ править ]

Бесконечно повторяющаяся дилемма заключенных - хорошо известный пример стратегии мрачного триггера. Обычная игра для двух заключенных выглядит следующим образом:

Заключенный B Заключенный А	Остается молчаливым (Сотрудничать)	Предать (дефект)
Остается молчаливым (Сотрудничать)	1, 1	-1, 2
Предать (дефект)	2, -1	0, 0

В дилемме заключенных у каждого игрока есть два варианта выбора на каждом этапе:

Сотрудничать
Дефект ради немедленной выгоды

Если игрок ошибается, он будет наказан до конца игры. Фактически, обоим игрокам лучше хранить молчание (сотрудничать), чем предавать друг друга, поэтому игра (C, C) - это кооперативный профиль, а игра (D, D), также уникальное равновесие по Нэшу в этой игре, является профиль наказания.

В стратегии мрачного триггера игрок сотрудничает в первом и последующих раундах до тех пор, пока его противник не нарушит соглашение. Как только игрок обнаруживает, что противник предал в предыдущей игре, он навсегда дезертирует.

Чтобы оценить совершенное равновесие (SPE) во вспомогательной игре для следующей мрачной стратегии запуска игры, стратегия S * для игроков i и j выглядит следующим образом:

Играйте C в каждом периоде, если кто-то никогда не играл в D в прошлом
Играйте в D вечно, если кто-то играл в D в прошлом ^[2]

Тогда стратегия является SPE, только если коэффициент дисконтирования равен . Другими словами, ни Игрок 1, ни Игрок 2 не заинтересованы в отказе от профиля сотрудничества, если коэффициент скидки больше половины. ^[3] ${\ textstyle \ delta \ geq {\ frac {1} {2}}}$

Чтобы доказать, что стратегия является SPE, сотрудничество должно быть лучшим ответом на сотрудничество другого игрока, а отступление должно быть лучшим ответом на отступничество другого игрока. ^[2]

Шаг 1: Предположим, что D до сих пор не играл.

Выплата игрока i от C: ${\ displaystyle (1- \ delta) [1+ \ delta + \ delta ^ {2} + ...] = (1- \ delta) \ times {\ frac {1} {1- \ delta}} = 1 }$
Выплата игрока i от D: ${\ Displaystyle (1- \ дельта) [2 + 0 + 0 + ...] = 2 (1- \ дельта)}$

Тогда C лучше, чем D, если . Это показывает, что если игра C оптимальна для Парето . ${\ Displaystyle 1 \ GEQ 2 (1- \ дельта)}$ $\delta \geq {\frac {1}{2}}$

Шаг 2: Предположим, что кто-то ранее играл D, тогда Игрок j будет играть D несмотря ни на что.

Выплата игрока i от C: $(1-\delta )[-1+\delta \times 0+\delta ^{2}\times 0+...]=(1-\delta )\times -1=\delta -1$
Выплата игрока i от D: $(1-\delta )[0+\delta \times 0+\delta ^{2}\times 0+...]=0$

Поскольку игра D оптимальна. $0\leq \delta \leq 1$

Предыдущий аргумент подчеркивает, что нет стимула отклоняться (без выгодного отклонения) от профиля сотрудничества, если , и это верно для каждой вспомогательной игры. Следовательно, стратегия для бесконечно повторяющейся дилеммы заключенного - это подыгровое идеальное равновесие по Нэшу. $\delta \geq {\frac {1}{2}}$

В повторяющихся соревнованиях по стратегии дилеммы заключенного мрачный триггер плохо работает даже без шума , а добавление ошибок сигнала делает его еще хуже. Его способность угрожать постоянным отступничеством дает ему теоретически эффективный способ поддерживать доверие, но из-за его неумолимого характера и неспособности сообщить об этой угрозе заранее, он работает плохо. ^[4]

Мрачный спусковой крючок в международных отношениях [ править ]

Под мрачным спусковым крючком с точки зрения международных отношений нация сотрудничает только в том случае, если ее партнер никогда не использовал это в прошлом. Поскольку нация будет отказываться от сотрудничества во всех будущих периодах, как только ее партнер однажды откажется от сотрудничества, бессрочное прекращение сотрудничества становится угрозой, которая делает такую стратегию ограничивающей. ^[5] Хотя мрачный спусковой крючок является ограничивающим случаем, теорема Фолка утверждает, что идеальное равновесие может быть достигнуто, если обе нации проявят терпение. ^[6]

Мрачный триггер во взаимодействии пользователя и сети [ править ]

Теория игр недавно использовалась при разработке будущих систем связи, и пользователь в игре взаимодействия пользователя с сетью, использующей стратегию мрачного триггера, является одним из таких примеров. ^[7] Если решено использовать мрачный триггер в игре взаимодействия пользователя с сетью, пользователь остается в сети (сотрудничает), если сеть поддерживает определенное качество, но наказывает сеть, останавливая взаимодействие и покидая сеть как как только пользователь обнаруживает дефекты противника. ^[8] Антониу и др. поясняет, что «при такой стратегии у сети появляется более сильный стимул выполнять обещание, данное в отношении определенного качества, поскольку она сталкивается с угрозой навсегда потерять своего клиента». ^[7]

Сравнение с другими стратегиями [ править ]

Стратегии « око за око» и «мрачный спусковой крючок» схожи по своей природе в том, что обе являются триггерной стратегией, когда игрок отказывается сначала отступить, если у него есть возможность наказать оппонента за отступление. Разница, однако, в том, что мрачный спусковой крючок требует максимального наказания за одно отступничество, в то время как «око за око» более снисходительно, предлагая одно наказание за каждое отступничество. ^[9]

См. Также [ править ]

Ссылки [ править ]

^ Фридман, Джеймс У. (1971). «Некооперативное равновесие для суперигр». Обзор экономических исследований . 38 (1): 1–12. DOI : 10.2307 / 2296617 .
^ a b Аджемоглу, Дарон (2 ноября 2009 г.). «Повторные игры и сотрудничество» .
↑ Левин, Джонатан (май 2006 г.). «Повторяющиеся игры I: идеальный мониторинг» (PDF) .
^ Аксельрод, Роберт (2000). «О шести достижениях в теории сотрудничества» (PDF) . Проверено 2 ноября 2007 . (стр.13)
^ Макгилливра, Фиона; Смит, Аластер (2000). «Доверие и сотрудничество через агентурные наказания». Международная организация . 54 (4): 809–824. DOI : 10.1162 / 002081800551370 .
^ Фуденберг, Дрю; Маскин, Эрик (май 1986). «Народная теорема в повторяющихся играх с дисконтом или с неполной информацией». Econometrica . 54 (3): 533–554. CiteSeerX 10.1.1.308.5775 . DOI : 10.2307 / 1911307 .
^ a b Антониу, Жозефина; Пападопулу, Вики (ноябрь 2009 г.). «Совместные пользовательско-сетевые взаимодействия в сетях связи нового поколения». Компьютерные сети . 54 (13): 2239–2255. DOI : 10.1016 / j.comnet.2010.03.013 .
^ Антониу, Жозефина; Петрос А. Иоанну (2016). Теория игр в коммуникационных сетях: совместное решение интерактивных сетевых сценариев . CRC Press. ISBN 9781138199385.
^ Баурманн, Майкл; Лейст, Антон (май 2016 г.). «О шести достижениях в теории кооперации». Журнал философии и социальной теории . 22 (1): 130–151.

[1] Фридман, Джеймс У. (1971). «Некооперативное равновесие для суперигр». Обзор экономических исследований . 38 (1): 1–12. DOI : 10.2307 / 2296617 .

[:0-2] Аджемоглу, Дарон (2 ноября 2009 г.). «Повторные игры и сотрудничество» .

[3] Левин, Джонатан (май 2006 г.). «Повторяющиеся игры I: идеальный мониторинг» (PDF) .

[4] Аксельрод, Роберт (2000). «О шести достижениях в теории сотрудничества» (PDF) . Проверено 2 ноября 2007 . (стр.13)

[5] Макгилливра, Фиона; Смит, Аластер (2000). «Доверие и сотрудничество через агентурные наказания». Международная организация . 54 (4): 809–824. DOI : 10.1162 / 002081800551370 .

[6] Фуденберг, Дрю; Маскин, Эрик (май 1986). «Народная теорема в повторяющихся играх с дисконтом или с неполной информацией». Econometrica . 54 (3): 533–554. CiteSeerX 10.1.1.308.5775 . DOI : 10.2307 / 1911307 .

[:1-7] Антониу, Жозефина; Пападопулу, Вики (ноябрь 2009 г.). «Совместные пользовательско-сетевые взаимодействия в сетях связи нового поколения». Компьютерные сети . 54 (13): 2239–2255. DOI : 10.1016 / j.comnet.2010.03.013 .

[8] Антониу, Жозефина; Петрос А. Иоанну (2016). Теория игр в коммуникационных сетях: совместное решение интерактивных сетевых сценариев . CRC Press. ISBN 9781138199385.

[9] Баурманн, Майкл; Лейст, Антон (май 2016 г.). «О шести достижениях в теории кооперации». Журнал философии и социальной теории . 22 (1): 130–151.

[1]

vтеТемы по теории игр
Определения	Игра с перегрузкой Кооперативная игра Решительность Эскалация обязательств Игра в расширенной форме Победа первого и второго игрока Сложность игры Язык описания игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Лаконичная игра
Концепции равновесия	равновесие по Нэшу Совершенство подигры Устойчивое равновесие по Мертенсу Байесовское равновесие по Нэшу Идеальное байесовское равновесие Дрожащая рука Правильное равновесие Эпсилон-равновесие Коррелированное равновесие Последовательное равновесие Квази-совершенное равновесие Эволюционно устойчивая стратегия Доминирование риска Основной Значение Шепли Парето эффективность Равновесие Гиббса Равновесие с квантовым откликом Самоподтверждающееся равновесие Сильное равновесие по Нэшу Марковское идеальное равновесие
Стратегии	Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент кражи стратегии Око за око Мрачный спусковой крючок Сговор Обратная индукция Прямая индукция Марковская стратегия Затенение ставки
Классы игр	Симметричная игра Идеальная информация Повторная игра Сигнальная игра Скрининговая игра Дешевый разговор Игра с нулевой суммой Конструкция механизма Проблема торга Стохастическая игра Средняя игра n -пользовательская игра Большая игра Пуассона Нетранзитивная игра Глобальная игра Строго определенная игра Возможная игра
Игры	Идти Шахматы Бесконечные шахматы Шашки Крестики-нолики Дилемма заключенного Игра по обмену подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица Сороконожка игра Сигнальная игра Льюиса Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Камень ножницы Бумага Пиратская игра Диктаторская игра Игра в общественные блага Блотто игра Война на истощение Проблема с баром Эль Фарол Справедливое деление Ярмарка нарезки торта Игра Курно Тупик Дилемма закусочной Угадайте 2/3 среднего Покер куна Игра Нэша в торг Индукционные пазлы Доверительная игра Игра принцесс и монстров Проблема рандеву
Теоремы	Теорема невозможности Эрроу Теорема согласия Ауманна Народная теорема Теорема о минимаксе Теорема Нэша Теорема очищения Принцип откровения Теорема Цермело
Ключевые цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Даниэль Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсани Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Разнообразный	All-pay аукцион Альфа – бета обрезка Парадокс бертрана Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации Совместное соревнование Эволюционная теория игр Преимущество первого хода в шахматах Игровая механика Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыигрышная ситуация Решение шахмат Топологическая игра Трагедия общественного достояния Тирания маленьких решений