Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В теории игр , мрачная триггер (также называемая мрачной стратегия или просто мрачная ) является стратегия запуска для повторной игры.

Первоначально игрок, использующий мрачный триггер, будет сотрудничать, но как только противник откажется (таким образом удовлетворяя условию триггера), игрок, использующий мрачный триггер, откажется от оставшейся части повторяемой игры. Поскольку один-единственный дефект оппонента вызывает отступничество навсегда, мрачный спусковой крючок - самая жесткая из стратегий в повторяющейся игре.

В книге Роберта Аксельрода « Эволюция сотрудничества» мрачный спусковой крючок назван «Фридман» из статьи Джеймса Фридмана 1971 года, в которой используется эта концепция. [1]

Бесконечно повторяющаяся дилемма заключенных [ править ]

Бесконечно повторяющаяся дилемма заключенных - хорошо известный пример стратегии мрачного триггера. Обычная игра для двух заключенных выглядит следующим образом:

В дилемме заключенных у каждого игрока есть два варианта выбора на каждом этапе:

  1. Сотрудничать
  2. Дефект ради немедленной выгоды

Если игрок ошибается, он будет наказан до конца игры. Фактически, обоим игрокам лучше хранить молчание (сотрудничать), чем предавать друг друга, поэтому игра (C, C) - это кооперативный профиль, а игра (D, D), также уникальное равновесие по Нэшу в этой игре, является профиль наказания.

В стратегии мрачного триггера игрок сотрудничает в первом и последующих раундах до тех пор, пока его противник не нарушит соглашение. Как только игрок обнаруживает, что противник предал в предыдущей игре, он навсегда дезертирует.

Чтобы оценить совершенное равновесие (SPE) во вспомогательной игре для следующей мрачной стратегии запуска игры, стратегия S * для игроков i и j выглядит следующим образом:

  • Играйте C в каждом периоде, если кто-то никогда не играл в D в прошлом
  • Играйте в D вечно, если кто-то играл в D в прошлом [2]

Тогда стратегия является SPE, только если коэффициент дисконтирования равен . Другими словами, ни Игрок 1, ни Игрок 2 не заинтересованы в отказе от профиля сотрудничества, если коэффициент скидки больше половины. [3]

Чтобы доказать, что стратегия является SPE, сотрудничество должно быть лучшим ответом на сотрудничество другого игрока, а отступление должно быть лучшим ответом на отступничество другого игрока. [2]

Шаг 1: Предположим, что D до сих пор не играл.

  • Выплата игрока i от C:
  • Выплата игрока i от D:

Тогда C лучше, чем D, если . Это показывает, что если игра C оптимальна для Парето .

Шаг 2: Предположим, что кто-то ранее играл D, тогда Игрок j будет играть D несмотря ни на что.

  • Выплата игрока i от C:
  • Выплата игрока i от D:

Поскольку игра D оптимальна.

Предыдущий аргумент подчеркивает, что нет стимула отклоняться (без выгодного отклонения) от профиля сотрудничества, если , и это верно для каждой вспомогательной игры. Следовательно, стратегия для бесконечно повторяющейся дилеммы заключенного - это подыгровое идеальное равновесие по Нэшу.

В повторяющихся соревнованиях по стратегии дилеммы заключенного мрачный триггер плохо работает даже без шума , а добавление ошибок сигнала делает его еще хуже. Его способность угрожать постоянным отступничеством дает ему теоретически эффективный способ поддерживать доверие, но из-за его неумолимого характера и неспособности сообщить об этой угрозе заранее, он работает плохо. [4]

Мрачный спусковой крючок в международных отношениях [ править ]

Под мрачным спусковым крючком с точки зрения международных отношений нация сотрудничает только в том случае, если ее партнер никогда не использовал это в прошлом. Поскольку нация будет отказываться от сотрудничества во всех будущих периодах, как только ее партнер однажды откажется от сотрудничества, бессрочное прекращение сотрудничества становится угрозой, которая делает такую ​​стратегию ограничивающей. [5] Хотя мрачный спусковой крючок является ограничивающим случаем, теорема Фолка утверждает, что идеальное равновесие может быть достигнуто, если обе нации проявят терпение. [6]

Мрачный триггер во взаимодействии пользователя и сети [ править ]

Теория игр недавно использовалась при разработке будущих систем связи, и пользователь в игре взаимодействия пользователя с сетью, использующей стратегию мрачного триггера, является одним из таких примеров. [7] Если решено использовать мрачный триггер в игре взаимодействия пользователя с сетью, пользователь остается в сети (сотрудничает), если сеть поддерживает определенное качество, но наказывает сеть, останавливая взаимодействие и покидая сеть как как только пользователь обнаруживает дефекты противника. [8] Антониу и др. поясняет, что «при такой стратегии у сети появляется более сильный стимул выполнять обещание, данное в отношении определенного качества, поскольку она сталкивается с угрозой навсегда потерять своего клиента». [7]

Сравнение с другими стратегиями [ править ]

Стратегии « око за око» и «мрачный спусковой крючок» схожи по своей природе в том, что обе являются триггерной стратегией, когда игрок отказывается сначала отступить, если у него есть возможность наказать оппонента за отступление. Разница, однако, в том, что мрачный спусковой крючок требует максимального наказания за одно отступничество, в то время как «око за око» более снисходительно, предлагая одно наказание за каждое отступничество. [9]

См. Также [ править ]

Ссылки [ править ]

  1. ^ Фридман, Джеймс У. (1971). «Некооперативное равновесие для суперигр». Обзор экономических исследований . 38 (1): 1–12. DOI : 10.2307 / 2296617 .
  2. ^ a b Аджемоглу, Дарон (2 ноября 2009 г.). «Повторные игры и сотрудничество» .
  3. Левин, Джонатан (май 2006 г.). «Повторяющиеся игры I: идеальный мониторинг» (PDF) .
  4. ^ Аксельрод, Роберт (2000). «О шести достижениях в теории сотрудничества» (PDF) . Проверено 2 ноября 2007 . (стр.13)
  5. ^ Макгилливра, Фиона; Смит, Аластер (2000). «Доверие и сотрудничество через агентурные наказания». Международная организация . 54 (4): 809–824. DOI : 10.1162 / 002081800551370 .
  6. ^ Фуденберг, Дрю; Маскин, Эрик (май 1986). «Народная теорема в повторяющихся играх с дисконтом или с неполной информацией». Econometrica . 54 (3): 533–554. CiteSeerX 10.1.1.308.5775 . DOI : 10.2307 / 1911307 . 
  7. ^ a b Антониу, Жозефина; Пападопулу, Вики (ноябрь 2009 г.). «Совместные пользовательско-сетевые взаимодействия в сетях связи нового поколения». Компьютерные сети . 54 (13): 2239–2255. DOI : 10.1016 / j.comnet.2010.03.013 .
  8. ^ Антониу, Жозефина; Петрос А. Иоанну (2016). Теория игр в коммуникационных сетях: совместное решение интерактивных сетевых сценариев . CRC Press. ISBN 9781138199385.
  9. ^ Баурманн, Майкл; Лейст, Антон (май 2016 г.). «О шести достижениях в теории кооперации». Журнал философии и социальной теории . 22 (1): 130–151.