Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В теории игр , A коррелированных равновесия является концепция решения , что является более общим , чем хорошо известным равновесие Нэша . Впервые это было обсуждено математиком Робертом Ауманом в 1974 году. [1] [2] Идея состоит в том, что каждый игрок выбирает свое действие в соответствии со своими личными наблюдениями за значением одного и того же открытого сигнала. Стратегия назначает действие каждому возможному наблюдению, которое может сделать игрок. Если ни один игрок не захочет отклоняться от своей стратегии (при условии, что другие также не отклоняются), распределение, из которого поступают сигналы, называется коррелированным равновесием.

Формальное определение [ править ]

-Плеер стратегическая игра характеризуется набором действий и функция полезности для каждого игрока . Когда игрок выбирает стратегию, а оставшиеся игроки выбирают профиль стратегии, описываемый -кортежем , тогда полезность игрока равна .

Модификация стратегии для игрока является функцией . То есть говорит игроку изменить свое поведение, выполняя действие, когда ему дана команда играть .

Позвольте быть счетное вероятностное пространство . Для каждого игрока , пусть будет его информационный раздел, быть «s кзади и пусть , назначая такое же значение для состояний в одной и той же ячейке » информационного раздела s. Тогда будет коррелированное равновесие стратегической игры, если для каждого игрока и для каждой модификации стратегии :

Другими словами, это коррелированное равновесие, если ни один игрок не может улучшить свою ожидаемую полезность с помощью модификации стратегии.

Пример [ править ]

Рассмотрим изображенную игру с цыпленком . В этой игре два человека бросают вызов друг другу в состязании, в котором каждый может либо осмелиться, либо сдаться . Если один собирается осмелиться, другому лучше струсить. Но если один собирается струсить, другому лучше осмелиться. Это приводит к интересной ситуации, когда каждый хочет осмелиться, но только если другой откажется.

В этой игре есть три равновесия по Нэшу . Две чистые стратегии равновесия по Нэшу - это ( D , C ) и ( C , D ). Также существует смешанная стратегия равновесия, когда каждый игрок решается с вероятностью 1/3.

Теперь рассмотрим третье лицо (или какое-то естественное событие), которое вытягивает одну из трех карт, помеченных: ( C , C ), ( D , C ) и ( C , D ) с одинаковой вероятностью, то есть вероятностью 1/3 для каждой. карта. После вытягивания карты третье лицо сообщает игрокам стратегию, назначенную им на карте (но не стратегию, назначенную их противнику). Предположим, игроку назначена D , он не хотел бы отклоняться, предполагая, что другой игрок применяет назначенную им стратегию, поскольку он получит 7 (максимально возможный выигрыш). Предположим , что игрок назначается C . Затем другой игрок сыграет Cс вероятностью 1/2 и D с вероятностью 1/2. Ожидаемая полезность дерзких 7 (1/2) + 0 (1/2) = 3,5 и ожидаемая полезность chickening из 2 (1/2) + 6 (1/2) = 4. Таким образом, игрок будет предпочитаю струсить.

Поскольку ни у одного игрока нет стимула отклоняться, это коррелированное равновесие. Ожидаемый выигрыш для этого равновесия составляет 7 (1/3) + 2 (1/3) + 6 (1/3) = 5, что выше, чем ожидаемый выигрыш смешанной стратегии равновесия по Нэшу.

Следующее коррелированное равновесие имеет еще более высокий выигрыш для обоих игроков: рекомендовать ( C , C ) с вероятностью 1/2 и ( D , C ) и ( C , D ) с вероятностью 1/4 каждое. Затем, когда игроку рекомендуют сыграть C , он знает, что другой игрок будет играть D с (условной) вероятностью 1/3 и C с вероятностью 2/3, и получит ожидаемый выигрыш 14/3, который равен (не менее чем) ожидаемый выигрыш, когда она играет D. В этом коррелированном равновесии оба игрока получают ожидание 5,25. Можно показать, что это коррелированное равновесие с максимальной суммой ожидаемых выплат для двух игроков.

Изучение коррелированных равновесий [ править ]

Одно из преимуществ коррелированных равновесий состоит в том, что они менее затратны в вычислительном отношении, чем равновесия Нэша . Это может быть зафиксировано тем фактом, что для вычисления коррелированного равновесия требуется только решение линейной программы, тогда как решение равновесия по Нэшу требует полного нахождения его фиксированной точки. [3] Другой способ увидеть это заключается в том, что два игрока могут реагировать на исторические ходы игры друг друга и в конечном итоге прийти к коррелированному равновесию. [4]

Ссылки [ править ]

  1. ^ Ауманн, Роберт (1974). «Субъективность и корреляция в рандомизированных стратегиях». Журнал математической экономики . 1 (1): 67–96. CiteSeerX  10.1.1.120.1740 . DOI : 10.1016 / 0304-4068 (74) 90037-8 .
  2. ^ Ауманн, Роберт (1987). «Коррелированное равновесие как выражение байесовской рациональности». Econometrica . 55 (1): 1–18. CiteSeerX 10.1.1.295.4243 . DOI : 10.2307 / 1911154 . JSTOR 1911154 .  
  3. ^ Пападимитриу, Христос Х .; Roughgarden, Тим (2008). «Вычисление коррелированных равновесий в многопользовательских играх». J. ACM . 55 (3): 14: 1–14: 29. CiteSeerX 10.1.1.335.2634 . DOI : 10.1145 / 1379759.1379762 . 
  4. ^ Фостер, Дин П .; Вохра, Ракеш В. (1996). «Калиброванное обучение и коррелированное равновесие». Игры и экономическое поведение .

Источники [ править ]

  • Фуденберг, Дрю и Жан Тироль (1991) Теория игр , MIT Press , 1991, ISBN 0-262-06141-4 
  • Лейтон-Браун, Кевин; Шохам, Йоав (2008), Основы теории игр: краткое, многопрофильное введение , Сан-Рафаэль, Калифорния: Издательство Morgan & Claypool, ISBN 978-1-59829-593-1. 88-страничное математическое введение; см. раздел 3.5. Бесплатный онлайн во многих университетах.
  • Осборн, Мартин Дж. И Ариэль Рубинштейн (1994). Курс теории игр , MIT Press. ISBN 0-262-65040-1 (современное введение для выпускников) 
  • Шохам, Йоав; Лейтон-Браун, Кевин (2009), Многоагентные системы: алгоритмические, теоретико-игровые и логические основы , Нью-Йорк: Cambridge University Press , ISBN 978-0-521-89943-7. Исчерпывающий справочник с вычислительной точки зрения; см. разделы 3.4.5 и 4.6. Скачать бесплатно онлайн .
  • Эва Тардос (2004) Заметки для занятий по теории алгоритмических игр (обратите внимание на важную опечатку) [1]
  • Искандер Карибжанов. Код MATLAB для построения набора коррелированных равновесий в игре нормальной формы для двух игроков
  • Ноам Нисан (2005) Конспект лекций из курса « Темы на границе экономики и вычислений» (строчная u должна быть заменена на u_i) [2]