Сверхрациональность

В экономике и теории игр считается, что участник обладает сверхрациональностью (или перенормированной рациональностью ), если он обладает совершенной рациональностью (и, таким образом, максимизирует свою полезность ), но предполагает, что все другие игроки тоже сверхрациональны и что сверхрациональная личность всегда будет предлагать та же стратегия, что и любой другой сверхрациональный мыслитель, когда сталкивается с той же проблемой. Применяя это определение, суперрациональный игрок, играющий против суперрационального противника в дилемме заключенного, будет сотрудничать, в то время как рационально эгоистичный игрок дезертирует.

Это правило принятия решений не является основной моделью в теории игр и было предложено Дугласом Хофштадтером в его статье, серии статей и книге « Метамагические темы» ^[1] как альтернативный тип рационального принятия решений, отличный от широко принятого в теории игр . Superrationality является формой Иммануила Канта «s категорический императив , ^[2]^[3] и тесно связан с понятием кантовского равновесия , предложенным экономистом и аналитическим марксистским Джоном Ремер . ^[4] Хофштадтер дал следующее определение: «Сверхрациональные мыслители, по рекурсивному определению, включают в свои вычисления тот факт, что они находятся в группе сверхрациональных мыслителей». ^[1] Это эквивалентно рассуждению, как будто все в группе подчиняются категорическому императиву Канта: «нужно предпринимать те действия, и только те действия, за которые он будет защищать, все остальные тоже должны». ^[4]

В отличие от предполагаемого « человека , отвечающего взаимностью », сверхрациональный мыслитель не всегда будет играть равновесие, которое максимизирует общую социальную полезность, и поэтому не является филантропом .

Дилемма заключенного

Идея сверхрациональности заключается в том, что два логических мыслителя, анализирующих одну и ту же проблему, придут к одному и тому же правильному ответу. Например, если два человека хорошо разбираются в математике и обоим поставили одну и ту же сложную задачу, оба получат один и тот же правильный ответ. В математике знание того, что два ответа будут одинаковыми, не меняет ценности проблемы, но в теории игр знание того, что ответ будет одинаковым, может изменить сам ответ.

В Дилемма заключенного обычно оформлен с точкой зрения тюремного заключения для преступников, но можно сказать , одинаково хорошо с денежными призами вместо. Каждому из двух игроков предоставляется выбор: сотрудничать (C) или дезертировать (D). Игроки выбирают, не зная, что собирается делать другой. Если оба будут сотрудничать, каждый получит по 100 долларов. Если они оба откажутся, каждый получит по 1 доллару. Если один будет сотрудничать, а другой откажется, то проигравший игрок получит 200 долларов, а сотрудничающий игрок ничего не получит.

Четыре исхода и выплаты каждому игроку перечислены ниже.

	Игрок B сотрудничает	Дефекты игрока B
Игрок А сотрудничает	Оба получают по 100 долларов	Игрок A: 0 долларов Игрок B: 200 долларов
Игрок А дефекты	Игрок A: 200 долларов Игрок B: 0 долларов	Оба получают 1 доллар

Один из действенных способов рассуждать для игроков заключается в следующем:

Предполагая, что другой игрок ошибается, если я буду сотрудничать, я ничего не получу, а если я откажусь, я получу доллар.
Предполагая, что другой игрок сотрудничает, я получаю 100 долларов, если я буду сотрудничать, и 200 долларов, если я откажусь.
Итак, что бы ни делал другой игрок, мой выигрыш увеличивается за счет отказа, хотя бы на один доллар.

Напрашивается вывод, что разумнее всего отступить. Этот тип рассуждений определяет теоретико-игровую рациональность, и два теоретико-игровых рациональных игрока, играющих в эту игру, оба ошибаются и получают по доллару каждый.

Сверхрациональность - альтернативный метод рассуждений. Во-первых, предполагается, что ответ на симметричную задачу будет одинаковым для всех суперрациональных игроков. Таким образом, сходство принимается во внимание до того, как будет определена стратегия. Стратегия находится путем максимизации выигрыша для каждого игрока при условии, что все они используют одну и ту же стратегию. Поскольку сверхрациональный игрок знает, что другой сверхрациональный игрок сделает то же самое, что бы это ни было, есть только два варианта для двух сверхрациональных игроков. Оба будут сотрудничать или оба откажутся, в зависимости от ценности сверхрационального ответа. Таким образом, оба сверхрациональных игрока будут сотрудничать, поскольку этот ответ максимизирует их выигрыш. Два суперрациональных игрока, играющих в эту игру, уйдут с каждым по 100 долларов.

Обратите внимание на то, что сверхрациональный игрок, играющий против теоретико-игрового рационального игрока, ошибается, поскольку стратегия предполагает только согласие сверхрациональных игроков. Сверхрациональный игрок, играющий против игрока с неопределенной сверхрациональностью, будет иногда отказываться, а иногда сотрудничать, исходя из вероятности того, что другой игрок будет сверхрациональным. ^{[ необходима цитата ]}

Хотя стандартная теория игр предполагает общепринятое знание рациональности, она делает это по-другому. Теоретико-игровой анализ максимизирует выигрыши, позволяя каждому игроку изменять стратегии независимо от других, даже если в конечном итоге он предполагает, что ответ в симметричной игре будет одинаковым для всех. Это определение теоретико-игрового равновесия по Нэшу , которое определяет стабильную стратегию как стратегию, при которой ни один игрок не может улучшить выплаты, изменив курс в одностороннем порядке. Суперрациональное равновесие в симметричной игре - это такое, в котором стратегии всех игроков должны быть одинаковыми до шага максимизации. (Не существует согласованного распространения концепции сверхрациональности на асимметричные игры.)

Некоторые утверждают, что сверхрациональность подразумевает своего рода магическое мышление, при котором каждый игрок предполагает, что его решение сотрудничать заставит другого игрока сотрудничать, даже если связи нет. Хофштадтер отмечает, что концепция «выбора» неприменима, когда цель игрока состоит в том, чтобы что-то выяснить, и что решение не побуждает другого игрока к сотрудничеству, а, скорее, та же логика приводит к тому же ответу независимо от общения. или причина и следствие. Эти дебаты касаются того, разумно ли для людей действовать сверхрациональным образом, а не того, что означает сверхрациональность, и аналогичны спорам о том, разумно ли для людей действовать «рациональным» образом, как это описано в теории игр. (где они могут выяснить, что другие игроки сделают или будут, задавая себе вопрос: что бы я делал на их месте, и применяя обратную индукцию и повторное исключение доминируемых стратегий ).

Вероятностные стратегии

Для простоты вышеприведенное описание сверхрациональности игнорировало смешанные стратегии : возможность того, что лучшим выбором может быть подбросить монетку или, в более общем смысле, выбрать разные исходы с некоторой вероятностью. В дилемме заключенного сверхрационально сотрудничать с вероятностью 1, даже когда допускаются смешанные стратегии, потому что средний выигрыш, когда один игрок сотрудничает, а другие дефекты такие же, как когда оба сотрудничают, и поэтому дезертирство увеличивает риск дезертирства обоих, что уменьшает ожидаемую выплату. Но в некоторых случаях сверхрациональная стратегия бывает смешанной.

Например, если выплаты следующие:

CC - 100 долларов США / 100 долларов США

CD - $ 0 / $ 1 000 000

DC - 1 000 000 долл. США / 0 долл. США

DD - 1 доллар / 1 доллар

Так что отказ приносит огромную награду, сверхрациональная стратегия дает сбой с вероятностью 499 900/99 9 899 или немногим более 49,995%. По мере того, как вознаграждение увеличивается до бесконечности, вероятность приближается только к 1/2, а потери от принятия более простой стратегии 1/2 (которые уже минимальны) приближаются к 0. В менее экстремальном примере, если выигрыш для одного кооператора и один перебежчик стоил 400 и 0 долларов соответственно, мир сверхрациональной смешанной стратегии будет сбегать с вероятностью 100/299 или примерно 1/3.

В аналогичных ситуациях с большим количеством игроков использование устройства рандомизации может быть важным. Одним из примеров, обсуждаемых Хофштадтером, является дилемма платонии : эксцентричный триллионер связывается с 20 людьми и говорит им, что если один и только один из них отправит ему или ей телеграмму (которая, как предполагается, ничего не стоит) к полудню следующего дня, этот человек получит миллиард долларов. Если они получат более одной телеграммы или вообще не получат ни одной, никто не получит денег, а общение между игроками запрещено. В этой ситуации суперрациональная вещь (если известно, что все 20 сверхрациональных) - это отправить телеграмму с вероятностью p = 1/20, то есть каждый получатель, по сути, бросает 20-гранный кубик и отправляет только телеграмму. если выпадет "1". Это максимизирует вероятность того, что будет получена ровно одна телеграмма.

Заметьте, однако, что это не решение в традиционном теоретико-игровом анализе. Каждый из двадцати теоретически рациональных игроков отправит телеграммы и, следовательно, ничего не получит. Это потому, что отправка телеграмм является доминирующей стратегией ; если отдельный игрок отправляет телеграммы, у него есть шанс получить деньги, но если он не отправляет телеграмм, он ничего не может получить. (Если бы все телеграммы были гарантированы, они отправили бы только одну, и никто не ожидал бы получить никаких денег).

Сверхрациональность

Дилемма заключенного

Вероятностные стратегии

Смотрите также

Рекомендации