Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Эволюционно стабильная стратегия ( ESS ) является стратегия (или набор стратегий) , который является непроницаемым , когда принят населением в адаптации к конкретной среде, то есть сказать , что это не может быть смещена по альтернативной стратегии (или набор стратегий) , которые может быть новым или изначально редким. Представленная Джоном Мейнардом Смитом и Джорджем Р. Прайсом в 1972/3 [1] [2], это важная концепция в поведенческой экологии , эволюционной психологии , математической теории игр и экономике , с приложениями в других областях, таких какантропология , философия и политология .

С точки зрения теории игр, ESS - это равновесное уточнение равновесия по Нэшу , являющееся равновесием по Нэшу, которое также является «эволюционно устойчивым ». Таким образом, будучи закрепленным в популяции, одного естественного отбора достаточно, чтобы предотвратить замену альтернативными ( мутантными ) стратегиями (хотя это не исключает возможности того, что лучшая стратегия или набор стратегий появится в ответ на давление отбора , возникающее в результате изменение окружающей среды).

История [ править ]

Эволюционно стабильные стратегии были определены и представлены Джоном Мейнардом Смитом и Джорджем Р. Прайсом в статье Nature 1973 года . [2] На рецензирование статьи для журнала Nature потребовалось столько времени, что этому предшествовало эссе 1972 года Мейнарда Смита в сборнике эссе под названием « Об эволюции» . [1] Иногда вместо статьи 1973 года цитируют эссе 1972 года, но в университетских библиотеках гораздо больше шансов иметь экземпляры журнала Nature . Статьи в Nature обычно короткие; в 1974 г. Мейнард Смит опубликовал более объемную статью в « Журнале теоретической биологии» . [3]Мейнард Смит объясняет это в своей книге 1982 года « Эволюция и теория игр» . [4] Иногда вместо них цитируют. Фактически, ESS стала настолько важной в теории игр, что часто не цитируется, поскольку предполагается, что читатель знаком с ней.

Мэйнард Смит математически формализовал словесный аргумент Прайса, который он прочитал, рецензируя статью Прайса. Когда Мейнард Смит понял, что несколько дезорганизованный Прайс не готов редактировать его статью для публикации, он предложил добавить Прайса в качестве соавтора.

Концепция была получена из RH МакАртура [5] и WD Hamilton «с [6] работы по половым коэффициентам , полученных из принципа Фишера , особенно (1967) концепции Гамильтон с уникальной стратегией . Мейнард Смит был совместно удостоен премии Crafoord Prize 1999 года за разработку концепции эволюционно устойчивых стратегий и применение теории игр к эволюции поведения. [7]

Использование ESS:

  • ESS был основным элементом, использованным для анализа эволюции в бестселлере Ричарда Докинза 1976 года «Эгоистичный ген» .
  • ESS впервые был использован в социальных науках по Роберт Аксельрод в своей книге 1984 Эволюция сотрудничества . С тех пор он широко используется в социальных науках, включая антропологию , экономику , философию и политологию .
  • В социальных науках основной интерес представляет не ESS как конец биологической эволюции, а как конечная точка культурной эволюции или индивидуального обучения. [8]
  • В эволюционной психологии ESS используется прежде всего как модель биологической эволюции человека .

Мотивация [ править ]

Равновесие Нэша является традиционной концепцией решения по теории игр . Это зависит от когнитивных способностей игроков. Предполагается, что игроки осведомлены о структуре игры и сознательно пытаются предсказать ходы своих противников и максимизировать свои собственные выигрыши . Кроме того, предполагается, что это знают все игроки (см. Общие сведения ). Эти предположения затем используются, чтобы объяснить, почему игроки выбирают равновесные стратегии по Нэшу.

Совершенно иначе мотивируются эволюционно устойчивые стратегии. Здесь предполагается, что стратегии игроков закодированы биологически и наследуются . Люди не могут контролировать свою стратегию и не должны знать об игре. Они размножаются и подвергаются силам естественного отбора , а выигрыш в игре представляет репродуктивный успех (биологическая пригодность ). Предполагается, что альтернативные стратегии игры иногда возникают в результате процесса, подобного мутации . Чтобы быть ESS, стратегия должна быть устойчивой к этим альтернативам.

Учитывая радикально разные мотивирующие предположения, может показаться удивительным, что ESS и равновесия по Нэшу часто совпадают. Фактически, каждая ESS соответствует равновесию по Нэшу, но некоторые равновесия по Нэшу не являются ESS.

Равновесие Нэша [ править ]

ESS - это усовершенствованная или модифицированная форма равновесия по Нэшу . (В следующем разделе приведены примеры, которые противопоставляют эти две стратегии. ) В равновесии по Нэшу, если все игроки принимают свои соответствующие части, ни один игрок не может извлечь выгоду , переключившись на любую альтернативную стратегию. В игре на двоих это пара стратегий. Пусть E ( S , T ) представляет выигрыш для игры стратегии S против стратегии T . Пара стратегий ( S , S ) является равновесием по Нэшу в игре для двух игроков тогда и только тогда, когда для обоих игроков для любой стратегии T :

E ( S , S ) ≥ E ( T , S )

Согласно этому определению, стратегия TS может быть нейтральной альтернативой S (набирает одинаково хорошо, но не лучше). Равновесие Нэша считается стабильным , даже если Т баллами одинаково, исходя из предположения , что нет никакого долгосрочного стимула для игроков принять T вместо S . Этот факт представляет собой отправную точку ESS.

Мэйнард Смит и Прайс [2] определяют два условия для того, чтобы стратегия S была ESS. Для всех TS либо

  1. E ( S , S )> E ( T , S ) или
  2. E ( S , S ) = E ( T , S ) и E ( S , T )> E ( T , T )

Первое условие иногда называют строгим равновесием по Нэшу. [9] Второе иногда называют «вторым состоянием Мейнарда Смита». Второе условие означает , что , хотя стратегия T является нейтральным по отношению к подкупу против стратегии S , население игроков , которые продолжают играть стратегию S имеет преимущество, играя против Т .

Существует также альтернативное, более сильное определение ESS, созданное Томасом. [10] Это делает другой акцент на роли концепции равновесия по Нэшу в концепции ESS. Следуя терминологии, данной в первом определении выше, это определение требует, чтобы для всех TS

  1. E ( S , S ) ≥ E ( T , S ) и
  2. Е ( S , Т )> Е ( Т , Т )

В этой формулировке первое условие определяет, что стратегия является равновесием по Нэшу, а второе указывает, что выполняется второе условие Мейнарда Смита. Обратите внимание, что эти два определения не являются в точности эквивалентными: например, каждая чистая стратегия в приведенной ниже координационной игре является ESS по первому определению, но не по второму.

На словах это определение выглядит так: выигрыш первого игрока, когда оба игрока играют в стратегию S, выше (или равен) выигрышу первого игрока, когда он переходит на другую стратегию T, а второй игрок сохраняет свою стратегию S и выигрыш первого игрока, когда только его противник меняет свою стратегию на T, выше, чем его выигрыш в случае, если оба игрока меняют свои стратегии на T.

Эта формулировка более четко подчеркивает роль условия равновесия по Нэшу в ESS. Это также позволяет дать естественное определение связанных понятий, таких как слабый ESS или эволюционно стабильный набор . [10]

Примеры различий между равновесиями Нэша и ESS [ править ]

В большинстве простых игр равновесия ESS и Нэша полностью совпадают. Например, в дилемме заключенного существует только одно равновесие по Нэшу, и его стратегия ( дефект ) также является ESS.

В некоторых играх могут быть равновесия по Нэшу, которые не являются ESS. Например, в случае нанесения вреда своему соседу (чья матрица выплат показана здесь) и ( A , A ), и ( B , B ) являются равновесиями по Нэшу, поскольку игроки не могут добиться большего, отказавшись от любого из них. Однако только B является ESS (и сильным Nash). Не является ESS, поэтому B может вторгнуться в нейтрально популяции А стратегов и преобладают, потому что B оценка выше против B , чем A делает против B . Эта динамика описывается вторым условием Мейнарда Смита, поскольку E (A , A ) = E ( B , A ), но это не тот случай, когда E ( A , B )> E ( B , B ).

Равновесия по Нэшу с равноценными альтернативами могут быть ESS. Например, в игре вред всем , C является ESS , потому что вторым условием оно удовлетворяет Мейнард Смита. Стратеги D могут временно вторгнуться в группу стратегов C , одинаково хорошо набрав очки против C , но они платят цену, когда начинают играть друг против друга; C баллов лучше против D , чем делает D . Итак, здесь, хотя E ( C , C ) = E ( D , C ), также верно, что E ( C , D )> E ( D ,D ). В результате C - это ESS.

Даже если в игре есть чистые стратегии равновесия по Нэшу, может оказаться, что ни одна из этих чистых стратегий не является ESS. Рассмотрим игру с курицей . В этой игре есть две чистые стратегии равновесия по Нэшу ( Swerve , Stay ) и ( Stay , Swerve ). Однако в отсутствие некоррелированной асимметрии ни Swerve, ни Stay не являются ESS. Существует третье равновесие по Нэшу, смешанная стратегия, которая является ESS для этой игры (см. «Игра ястребиного голубя» и « Лучший ответ» для объяснения).

Этот последний пример указывает на важное различие между равновесием Нэша и ESS. Равновесия по Нэшу определяются на наборах стратегий (спецификация стратегии для каждого игрока), в то время как ESS определяются в терминах самих стратегий. Равновесия, определенные ESS, всегда должны быть симметричными и, следовательно, иметь меньше точек равновесия.

Против. эволюционно стабильное состояние [ править ]

В популяционной биологии две концепции эволюционно стабильной стратегии (ESS) и эволюционно устойчивого состояния тесно связаны, но описывают разные ситуации.

В эволюционно стабильной стратегии, если все члены популяции примут ее, никакая мутантная стратегия не сможет вторгнуться. [4] Как только практически все члены населения используют эту стратегию, нет никакой «рациональной» альтернативы. ESS - это часть классической теории игр .

В эволюционно стабильном состоянии генетический состав популяции восстанавливается путем отбора после нарушения, если нарушение не слишком велико. Эволюционно стабильное состояние - это динамическое свойство популяции, которая возвращается к использованию стратегии или комбинации стратегий, если она нарушена из этого начального состояния. Это часть популяционной генетики , динамической системы или эволюционной теории игр . Теперь это называется конвергентной устойчивостью. [11]

Б. Томас (1984) применяет термин ESS к индивидуальной стратегии, которая может быть смешанной, а эволюционно стабильное состояние популяции - к совокупности чистых стратегий, которая может быть формально эквивалентна смешанной ESS. [12]

Является ли популяция эволюционно стабильной, не зависит от ее генетического разнообразия: она может быть генетически мономорфной или полиморфной . [4]

Стохастический ESS [ править ]

В классическом определении ESS никакая мутантная стратегия не может вторгнуться. В конечных популяциях любой мутант в принципе может вторгнуться, хотя и с малой вероятностью, что подразумевает, что ESS не может существовать. Вместо этого в бесконечной популяции ESS можно определить как стратегию, которая в случае вторжения новой мутантной стратегии с вероятностью p сможет противодействовать вторжению одного исходного индивидуума с вероятностью> p, как показано на примере эволюции бет-хеджирование . [13]

Дилемма заключенного [ править ]

Распространенной моделью альтруизма и социального сотрудничества является дилемма заключенного . Здесь группе игроков было бы лучше, если бы они могли играть в Cooperate , но, поскольку Defect работает лучше, у каждого отдельного игрока есть стимул играть в Defect . Одно из решений этой проблемы состоит в том, чтобы ввести возможность возмездия, заставляя людей многократно играть в игру против одного и того же игрока. В так называемой повторной дилемме заключенного одни и те же два человека снова и снова разыгрывают дилемму заключенного. В то время как дилемма заключенного имеет только две стратегии ( сотрудничество и отступление).) повторяющаяся дилемма Заключенного имеет огромное количество возможных стратегий. Поскольку у человека могут быть разные планы действий в чрезвычайных ситуациях для каждой истории, а игра может повторяться неограниченное количество раз, на самом деле может существовать бесконечное количество таких планов действий в чрезвычайных ситуациях.

Существенное внимание было уделено трем простым планам на случай непредвиденных обстоятельств: « Всегда отступать» , « Всегда сотрудничать» и « Око за око» . Первые две стратегии делают одно и то же независимо от действий другого игрока, в то время как последний отвечает в следующем раунде, делая то, что было сделано с ним в предыдущем раунде - он реагирует на сотрудничество с сотрудничеством и дефект с дефектом .

Если все население играет « Око за око» и появляется мутант, который играет « Всегда сбегать» , « Око за око» будет лучше, чем « Всегда сбегать» . Если популяция мутанта станет слишком большой - процент мутанта останется небольшим. Тит для Tat поэтому является ESS, в отношении только этих двух стратегий . С другой стороны, остров, на котором постоянно находятся игроки, будет устойчив к вторжению нескольких игроков « око за око », но не против большого их числа. [14] Если мы введем « Всегда сотрудничать» , популяция « око за око»больше не ESS. Поскольку популяция игроков « око за око » всегда сотрудничает, стратегия « Всегда сотрудничать» в этой популяции ведет себя идентично. В результате мутант, который играет « Всегда сотрудничать» , не будет удален. Однако даже при том, что популяция « Всегда сотрудничать» и « Око за око» может сосуществовать, если есть небольшой процент населения, которое всегда дезертирует , давление отбора направлено против « Всегда сотрудничать» и в пользу « око за ок» . Это происходит из-за меньшего вознаграждения за сотрудничество, чем за отказ от оппонента.

Это демонстрирует трудности применения формального определения ESS к играм с большими стратегическими пространствами и побудило некоторых рассмотреть альтернативы.

Человеческое поведение [ править ]

Области социобиологии и эволюционной психологии пытаются объяснить поведение и социальные структуры животных и человека, в основном с точки зрения эволюционно стабильных стратегий. Социопатия (хроническое антиобщественное или преступное поведение) может быть результатом комбинации двух таких стратегий. [15]

Эволюционно стабильные стратегии изначально рассматривались для биологической эволюции, но они могут применяться в других контекстах. Фактически, существуют стабильные состояния для большого класса адаптивной динамики . В результате их можно использовать для объяснения поведения человека, лишенного каких-либо генетических влияний.

См. Также [ править ]

  • Адаптация антихищника
  • Поведенческая экология
  • Эволюционная психология
  • Фитнес-пейзаж
  • Ястреб-голубь игра
  • Коинофилия
  • Социобиология
  • Война на истощение (игра)

Ссылки [ править ]

  1. ^ a b Мэйнард Смит, Дж. (1972). «Теория игр и эволюция борьбы». Об эволюции . Издательство Эдинбургского университета. ISBN 0-85224-223-9.
  2. ^ a b c Мэйнард Смит, Дж .; Цена, ГР (1973). «Логика конфликта животных». Природа . 246 (5427): 15–8. Бибкод : 1973Natur.246 ... 15S . DOI : 10.1038 / 246015a0 .
  3. Перейти ↑ Maynard Smith, J. (1974). «Теория игр и эволюция конфликтов между животными» (PDF) . Журнал теоретической биологии . 47 (1): 209–21. DOI : 10.1016 / 0022-5193 (74) 90110-6 . PMID 4459582 .  
  4. ^ a b c Мэйнард Смит, Джон (1982). Эволюция и теория игр . ISBN 0-521-28884-3.
  5. Перейти ↑ MacArthur, RH (1965). Waterman T .; Горовиц Х. (ред.). Теоретическая и математическая биология . Нью-Йорк: Блейсделл.
  6. ^ Гамильтон, WD (1967). «Чрезвычайное соотношение полов». Наука . 156 (3774): 477–88. Bibcode : 1967Sci ... 156..477H . DOI : 10.1126 / science.156.3774.477 . JSTOR 1721222 . PMID 6021675 .  
  7. Пресс-релиз о премии Crafoord Prize 1999 г.
  8. ^ Александр, Джейсон Маккензи (23 мая 2003 г.). «Эволюционная теория игр» . Стэнфордская энциклопедия философии . Проверено 31 августа 2007 года .
  9. ^ Харсаньи, J (1973 г.). «Странность числа точек равновесия: новое доказательство». Int. J. Теория игр . 2 (1): 235–50. DOI : 10.1007 / BF01737572 .
  10. ^ a b Томас, Б. (1985). «Об эволюционно устойчивых множествах». J. Math. Биология . 22 : 105–115. DOI : 10.1007 / bf00276549 .
  11. ^ Apaloo, J .; Браун, JS; Винсент, Т.Л. (2009). «Эволюционная теория игр: ESS, стабильность сходимости и NIS» . Исследования эволюционной экологии . 11 : 489–515. Архивировано из оригинала на 2017-08-09 . Проверено 10 января 2018 .
  12. ^ Томас, Б. (1984). «Эволюционная устойчивость: состояния и стратегии». Теор. Popul. Биол . 26 (1): 49–67. DOI : 10.1016 / 0040-5809 (84) 90023-6 .
  13. ^ Кинг, Оливер Д .; Масел, Джоанна (1 декабря 2007 г.). «Эволюция адаптации ставок-хеджирования к редким сценариям» . Теоретическая популяционная биология . 72 (4): 560–575. DOI : 10.1016 / j.tpb.2007.08.006 . PMC 2118055 . PMID 17915273 .  
  14. ^ Аксельрод, Роберт (1984). Эволюция сотрудничества . ISBN 0-465-02121-2.
  15. ^ Mealey, Л. (1995). «Социобиология социопатии: интегрированная эволюционная модель». Поведенческие науки и науки о мозге . 18 (3): 523–99. DOI : 10.1017 / S0140525X00039595 .

Дальнейшее чтение [ править ]

  • Вейбулл, Йорген (1997). Эволюционная теория игр . MIT Press . ISBN 978-0-262-73121-8. Классический справочник.
  • Хайнс, WGS (1987). «Эволюционно стабильные стратегии: обзор основ теории». Теоретическая популяционная биология . 31 (2): 195–272. DOI : 10.1016 / 0040-5809 (87) 90029-3 . PMID  3296292 .
  • Лейтон-Браун, Кевин; Шохам, Йоав (2008). Основы теории игр: краткое, междисциплинарное введение . Сан-Рафаэль, Калифорния: Издательство Morgan & Claypool. ISBN 978-1-59829-593-1.. 88-страничное математическое введение; см. раздел 3.8. Бесплатный онлайн во многих университетах.
  • Паркер, Г. А. (1984) Эволюционно стабильные стратегии. В поведенческой экологии: эволюционный подход (2-е изд.) Кребс, JR & Davies NB, ред. С. 30–61. Блэквелл, Оксфорд.
  • Шохам, Йоав; Лейтон-Браун, Кевин (2009). Мультиагентные системы: алгоритмические, теоретико-игровые и логические основы . Нью-Йорк: Издательство Кембриджского университета . ISBN 978-0-521-89943-7.. Исчерпывающий справочник с вычислительной точки зрения; см. раздел 7.7. Скачать бесплатно онлайн .
  • Мэйнард Смит, Джон . (1982) Эволюция и теория игр . ISBN 0-521-28884-3 . Классическая справка. 

Внешние ссылки [ править ]

  • Эволюционно стабильные стратегии поведения животных: онлайн-учебник Майкла Д. Брида.
  • Теория игр и эволюционно стабильные стратегии , сайт Кеннета Н. Прествича в Колледже Святого Креста.
  • Кнол "Эволюционно стабильные стратегии" [ постоянная мертвая ссылка ]