Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Диаграмма Стэнли Райтера выше иллюстрирует игру в дизайн механизмов. Верхнее левое пространство изображает пространство типов, а верхнее правое пространство X - пространство результатов. Социальный выбор функция отображает профиль типа к результату. В играх с конструкцией механизмов агенты отправляют сообщения в игровой среде . Равновесие в игре может быть разработано , чтобы реализовать какую - либо социальную функцию выбора .

Проектирование механизмов - это область экономики и теории игр, в которой используется подход , ориентированный на цели, при разработке экономических механизмов или стимулов для достижения желаемых целей в стратегических условиях , когда игроки действуют рационально . Поскольку она начинается в конце игры, а затем идет в обратном направлении, ее также называют теорией обратной игры . Он имеет широкое применение, начиная от экономики и политики в таких областях , как дизайн рынка , теории аукционов и теории общественного выбора к сетевым-системам (интернет междоменной маршрутизации, авторы поиска аукционов).

При проектировании механизмов изучаются концепции решений для класса приватно-информационных игр. Леонид Гурвич объясняет, что «в задаче проектирования целевая функция является главной« данностью », а механизм - неизвестным. Таким образом, проблема проектирования является «обратной» традиционной экономической теории, которая обычно посвящена анализу работы данного механизма ». [1] Итак, две отличительные особенности этих игр:

  • что "дизайнер" игры выбирает структуру игры, а не наследует ее
  • что дизайнер заинтересован в исходе игры

Нобелевская мемориальная премия по экономическим наукам 2007 года была присуждена Леониду Гурвицу , Эрику Маскину и Роджеру Майерсону «за то, что они заложили основы теории конструкции механизмов». [2]

Интуиция [ править ]

В интересном классе байесовских игр один игрок, называемый «принципалом», хотел бы обусловить свое поведение информацией, которая в частном порядке известна другим игрокам. Например, директор хочет знать истинное качество подержанной машины, которую продает продавец. Он ничего не может узнать, просто спросив продавца, потому что в его интересах исказить истину. Однако в разработке механизмов у принципала есть одно преимущество: он может разработать игру, правила которой могут повлиять на других, чтобы они действовали так, как он хотел.

Без теории конструкции механизмов проблему директора было бы трудно решить. Ему придется рассмотреть все возможные игры и выбрать ту, которая лучше всего влияет на тактику других игроков. Кроме того, доверитель должен будет делать выводы от агентов, которые могут ему лгать. Благодаря конструкции механизма и, в частности, принципу раскрытия информации , принципал должен учитывать только те игры, в которых агенты правдиво сообщают свою личную информацию.

Фонды [ править ]

Механизм [ править ]

Игра в разработку механизмов - это игра с частной информацией, в которой один из агентов, называемый принципалом, выбирает структуру выплаты. Следуя Харшани  ( 1967 ), агенты получают секретные «сообщения» от природы, содержащие информацию, относящуюся к выплатам. Например, сообщение может содержать информацию об их предпочтениях или качестве товара для продажи. Мы называем эту информацию «типом» агента (обычно отмечается и соответственно пространство типов ). Затем агенты сообщают директору о типе (обычно отмеченном шляпой ), который может быть стратегической ложью. После отчета принципалу и агентам выплачиваются выплаты в соответствии со структурой выплат, выбранной принципалом.

Время игры:

  1. Принципал подчиняется механизму, который предоставляет результат как функцию сообщаемого типа.
  2. Агенты сообщают, возможно, нечестно, типовой профиль
  3. Механизм выполнен (агенты получают результат )

Чтобы понять, кто что получает, принято делить результат на распределение товаров и денежный перевод, где означает распределение предоставленных или полученных товаров в зависимости от типа и означает денежный перевод как функцию тип.

В качестве эталона дизайнер часто определяет, что произойдет, если будет полная информация. Определите функцию общественного выбора, сопоставляющую (истинный) профиль типа непосредственно с распределением полученных или предоставленных товаров,

Напротив, механизм сопоставляет отчетный профиль типа с результатом (опять же, как распределение товаров, так и денежный перевод ).

Принцип откровения [ править ]

Предлагаемый механизм представляет собой байесовскую игру (игру частной информации), и при правильном ее использовании игра имеет байесовское равновесие по Нэшу . В состоянии равновесия агенты выбирают свои отчеты стратегически в зависимости от типа

В такой обстановке трудно найти байесовское равновесие, потому что оно включает в себя поиск стратегий наилучшего реагирования агентов и наилучший вывод из возможной стратегической лжи. Благодаря широкому результату, называемому принципом откровения, независимо от механизма, разработчик может [3] ограничить внимание равновесием, в котором агенты правдиво сообщают о типе. Принцип откровения гласит: «Каждому байесовскому равновесию по Нэшу соответствует байесовская игра с таким же исходом равновесия, но в которой игроки правдиво сообщают о типе».

Это очень полезно. Этот принцип позволяет найти байесовское равновесие, предполагая, что все игроки правдиво сообщают тип (с учетом ограничения совместимости стимулов ). Одним ударом он избавляет от необходимости рассматривать либо стратегическое поведение, либо ложь.

Его доказательство вполне прямое. Предположим байесовскую игру, в которой стратегия и выигрыш агента являются функциями его типа и того, что делают другие . По определению, стратегия равновесия агента i - это ожидаемая полезность по Нэшу:

Просто определите механизм, который побудит агентов выбрать одно и то же равновесие. Проще всего определить механизм, обязывающий играть за них равновесные стратегии агентов .

При таком механизме агенты, конечно, считают оптимальным выявление типа, поскольку механизм в любом случае использует стратегии, которые они сочли оптимальными. Формально выбираем такой, что

Реализуемость [ править ]

Разработчик механизма обычно надеется, что либо

  • разработать механизм, который "реализует" функцию социального выбора
  • найти механизм, который максимизирует некоторый критерий ценности (например, прибыль)

Чтобы реализовать функцию общественного выбора, необходимо найти некоторую передаточную функцию, которая мотивирует агентов выбирать результат . Формально, если профиль стратегии равновесия в рамках механизма соответствует тому же распределению товаров, что и функция общественного выбора,

мы говорим, что механизм реализует функцию социального выбора.

Благодаря принципу откровения разработчик обычно может найти передаточную функцию для реализации социального выбора, решив связанную с ним игру, рассказывающую правду. Если агенты сочтут оптимальным правдиво сообщать тип,

мы говорим, что такой механизм действительно реализуем (или просто «реализуем»). Затем задача состоит в том, чтобы найти правдиво реализуемую и приписать эту передаточную функцию исходной игре. Распределение действительно реализуемо, если существует передаточная функция такая, что

которое также называется ограничением совместимости стимулов (IC).

В приложениях условие IC является ключом к описанию формы любым полезным способом. При определенных условиях он может даже аналитически выделить передаточную функцию. Кроме того, иногда добавляется ограничение на участие ( индивидуальная рациональность ), если агенты имеют возможность не играть.

Необходимость [ править ]

Рассмотрим ситуацию, в которой у всех агентов есть функция полезности, зависящая от типа . Рассмотрим также распределение товаров с векторной оценкой и размером (которое допускает количество товаров) и предположим, что оно является кусочно-непрерывным по отношению к своим аргументам.

Функция реализуема, только если

всякий раз, когда и и x непрерывны в точке . Это необходимое условие, которое выводится из условий первого и второго порядка задачи оптимизации агента в предположении правдивости.

Его значение можно понять из двух частей. Первая часть говорит о том, что предельная скорость замещения агента (MRS) увеличивается в зависимости от типа,

Короче говоря, агенты не скажут правду, если механизм не предлагает более выгодные условия для агентов более высокого уровня. В противном случае более высокие типы, столкнувшись с любым механизмом, который наказывает высокие типы за сообщение, будут лгать и объявлять, что они являются низшими типами, нарушая ограничение IC правдивости. Вторая часть - это условие монотонности, ожидающее своего появления,

что, если быть положительным, означает, что более высоким типам нужно давать больше добра.

У этих двух частей есть потенциал для взаимодействия. Если для некоторого диапазона типов контракт предлагал меньшее количество для более высоких типов , возможно, механизм мог бы компенсировать, предоставляя более высокие типы скидки. Но такой договор уже существует для низкотипных агентов, поэтому это решение патологическое. Такое решение иногда возникает в процессе поиска механизма. В этих случаях его необходимо « погладить ». В среде с нескольких исправными также возможно для дизайнера наградить агент с более одного товаром для замены меньше других (например , масло для маргарина ). Множественные хорошие механизмы - постоянная проблема в теории проектирования механизмов.

Достаточность [ править ]

Документы по разработке механизмов обычно делают два допущения для обеспечения возможности реализации:

Это известно под несколькими названиями: условие однократного пересечения, условие сортировки и условие Спенса – Миррлиза. Это означает, что функция полезности имеет такую ​​форму, что тип MRS агента увеличивается.

Это техническое условие, ограничивающее темпы роста MRS.

Этих допущений достаточно, чтобы гарантировать, что любая монотонность реализуема ( существует такой, который может ее реализовать). Кроме того, в настройке «один-хороший» условие однократного пересечения является достаточным, чтобы обеспечить возможность реализации только монотонного , поэтому разработчик может ограничить свой поиск монотонным .

Выделенные результаты [ править ]

Теорема об эквивалентности доходов [ править ]

Викри  ( 1961 ) дает знаменитый результат, заключающийся в том, что любой участник большого класса аукционов гарантирует продавцу такой же ожидаемый доход и что ожидаемый доход - лучшее, что может сделать продавец. Это так, если

  1. Покупатели имеют идентичные оценочные функции (которые могут зависеть от типа).
  2. Типы покупателей распределяются независимо
  3. Типы покупателей выбираются из непрерывного распределения
  4. Распределение типов имеет свойство монотонной степени опасности.
  5. Механизм продает товар покупателю с наивысшей оценкой.

Последнее условие является ключевым для теоремы. Подразумевается, что для того, чтобы продавец получил более высокий доход, он должен рискнуть и передать товар агенту с более низкой оценкой. Обычно это означает, что он должен рискнуть вообще не продавать предмет.

Механизмы Викри-Кларка-Гроувса [ править ]

Модель аукциона Викри (1961) была позже расширена Кларком  ( 1971 ) и Гроувсом для решения проблемы общественного выбора, в которой расходы на общественный проект несут все агенты, например, строить ли муниципальный мост. Получающийся в результате механизм «Викри-Кларка-Гроувса» может мотивировать агентов выбирать социально эффективное распределение общественного блага, даже если агенты имеют частно известные оценки. Другими словами, он может разрешить « трагедию общин » - при определенных условиях, в частности, при квазилинейной полезности или если не требуется баланс бюджета.

Рассмотрим ситуацию, в которой количество агентов имеет квазилинейную полезность с частными оценками, где валюта оценивается линейно. Дизайнер VCG разрабатывает механизм, совместимый со стимулами (следовательно, правдиво реализуемый), для получения истинного профиля типа, из которого разработчик реализует социально оптимальное распределение.

Умный механизм VCG - это то, как он мотивирует правдивое откровение. Это устраняет стимулы к искажению информации, наказывая любого агента ценой искажения, которое он вызывает. Среди отчетов, которые может сделать агент, механизм VCG допускает «нулевой» отчет, в котором говорится, что он безразличен к общественному благу и заботится только о переводе денег. Это эффективно удаляет агента из игры. Если агент выбирает тип сообщения, механизм VCG взимает с агента плату, если его отчет является ключевым , то есть если его отчет изменяет оптимальное распределение x, чтобы нанести вред другим агентам. Оплата рассчитывается

который суммирует искажения полезности других агентов (а не его собственные), вызванные отчетом одного агента.

Теорема Гиббарда – Саттертуэйта [ править ]

Гиббард  ( 1973 ) и Саттертуэйт  ( 1975 ) приводят результат о невозможности, аналогичный по духу теореме о невозможности Эрроу . Для очень общего класса игр могут быть реализованы только «диктаторские» функции социального выбора.

Функция общественного выбора f () является диктаторской, если один агент всегда получает наиболее предпочтительное распределение благ,

Теорема утверждает, что в общих условиях любая реально реализуемая функция общественного выбора должна быть диктаторской, если:

  1. X конечно и содержит не менее трех элементов
  2. Предпочтения рациональны

Теорема Майерсона – Саттертуэйта [ править ]

Майерсон и Саттертуэйт ( 1983 ) показывают, что для двух сторон не существует эффективного способа торговать товаром, если каждая из них имеет секретные и вероятностно разные оценки, без риска вынудить одну сторону торговать в убыток. Это один из самых замечательных отрицательных результатов в экономике - своего рода отрицательное зеркало фундаментальных теорем экономики благосостояния .

Примеры [ править ]

Ценовая дискриминация [ править ]

Миррлис  ( 1971 ) вводит настройку, в которой передаточную функцию t () легко найти . Из-за своей актуальности и управляемости это обычное дело в литературе. Рассмотрим настройку с одним хорошим и одним агентом, в которой агент имеет квазилинейную утилиту с параметром неизвестного типа.

и в котором принципал имеет более раннюю CDF по сравнению с типом агента . Принципал может производить товары с выпуклой предельной стоимостью c ( x ) и хочет максимизировать ожидаемую прибыль от сделки.

в соответствии с условиями IC и IR

Принципал здесь - монополист, пытающийся установить максимальную прибыль ценовую схему, в которой он не может определить тип клиента. Типичный пример - это авиакомпания, устанавливающая тарифы для деловых людей, туристов и студентов. Из-за условия IR он должен дать каждому типу достаточно хорошую сделку, чтобы побудить к участию. Из-за условия IC он должен давать каждому типу достаточно хорошую сделку, чтобы этот тип предпочел эту сделку сделке любого другого.

Уловка, предложенная Миррлисом (1971), состоит в том, чтобы использовать теорему об огибающей, чтобы исключить передаточную функцию из ожидания максимизации,

Интеграция,

где - некоторый тип индекса. Заменив совместимость со стимулом в максимуме,

после интеграции по частям. Эта функция может быть максимизирована поточечно.

Поскольку он уже совместим со стимулами, дизайнер может отказаться от ограничения IC. Если функция полезности удовлетворяет условию Спенса – Миррлиса, то существует монотонная функция. Ограничение IR можно проверить в состоянии равновесия и соответственно увеличить или уменьшить график сборов. Кроме того, обратите внимание на наличие в выражении степени опасности . Если распределение типов обладает свойством монотонного отношения рисков, FOC достаточно для решения для t (). Если нет, то необходимо проверить, выполняется ли ограничение монотонности (см. Выше достаточность ) повсюду в графиках распределения и сборов. Если нет, то дизайнер должен использовать глажку Майерсона.

Майерсон гладит [ править ]

Можно найти товар или график цен, который удовлетворяет условиям первого порядка, но не является монотонным. В таком случае необходимо «утюжить» график, выбрав какое-то значение, при котором функция будет сглажена.

В некоторых приложениях разработчик может решить условия первого порядка для графиков цен и распределения, но обнаружит, что они не являются монотонными. Например, в квазилинейной настройке это часто происходит, когда отношение рисков само по себе не является монотонным. Согласно условию Спенса-Миррлиса оптимальные графики цен и распределения должны быть монотонными, поэтому разработчик должен исключить любой интервал, в течение которого график меняет направление, сглаживая его.

Наглядно, что происходит это дизайнер считает оптимальным сгусток определенных типов вместе и дают им один и тот же контракт. Обычно дизайнер мотивирует более высокие типы выделиться, предлагая им более выгодную сделку. Если количество более высоких типов на марже недостаточно, разработчик не считает целесообразным предоставлять более низким типам уступку (так называемую информационную ренту ), чтобы взимать более высокие типы по контракту, зависящему от типа.

Рассмотрим принципала-монополиста, продающего агентам с квазилинейной полезностью, как в примере выше. Предположим, что график распределения, удовлетворяющий условиям первого порядка, имеет один внутренний пик в точке и одну внутреннюю впадину в точке , показанной справа.

  • Следуя Майерсону (1981), сгладьте его, выбрав удовлетворительный
где - функция, обратная к отображению x, и - функция, обратная к отображению x в . То есть возвращает a до внутреннего пика и возвращает a после внутренней впадины.
  • Если немонотонная область граничит с границей пространства типов, просто установите соответствующую функцию (или обе) для типа границы. Если есть несколько регионов, см. Учебник для итеративной процедуры; может случиться так, что нужно гладить более одной кормушки вместе.

Доказательство [ править ]

Доказательство использует теорию оптимального управления. Он рассматривает набор интервалов в немонотонной области, по которым он может сгладить график. Затем он пишет гамильтониан, чтобы получить необходимые условия для a в пределах интервалов

  1. что удовлетворяет монотонность
  2. для которых ограничение монотонности не связывает границы интервала

Условие два гарантирует, что выполнение задачи оптимального управления повторно соединится с расписанием в исходной задаче на границах интервала (без скачков). Любой объект, удовлетворяющий необходимым условиям, должен быть плоским, потому что он должен быть монотонным и при этом повторно соединяться на границах.

Как и прежде, максимизировать ожидаемый выигрыш от принципала, но на этот раз с учетом ограничения монотонности

и использовать для этого гамильтониан с теневой ценой

где - переменная состояния и элемент управления. Как обычно при оптимальном управлении, уравнение эволюции затрат должно удовлетворять

Воспользовавшись условием 2, обратите внимание, что ограничение монотонности не является обязательным на границах интервала,

означает, что условие переменной стоимости может быть интегрировано и также равно 0

Среднее искажение излишка основного долга должно быть 0. Чтобы сгладить график, найдите такое, чтобы его обратное изображение отображалось в интервал, удовлетворяющий вышеуказанному условию.

См. Также [ править ]

  • Разработка алгоритмического механизма
  • Элвин Э. Рот - Нобелевская премия, дизайн рынка
  • Проблема с присвоением
  • Теория договора
  • Теория реализации
  • Поощрительная совместимость
  • Принцип откровения
  • Умный рынок
  • Метагейм

Заметки [ править ]

  1. ^ L. Hurwicz & S. Reiter (2006) Разработка экономических механизмов , стр. 30
  2. ^ "Премия Sveriges Riksbank в области экономических наук в память об Альфреде Нобеле 2007" (пресс-релиз). Нобелевский фонд . 15 октября 2007 . Проверено 15 августа 2008 .
  3. ^ В необычных обстоятельствах некоторые игры, говорящие о правде, имеют больше равновесий, чем байесовские игры, из которых они составили карту. См. Fudenburg-Tirole Ch. 7.2 для некоторых ссылок.

Ссылки [ править ]

  • Кларк, Эдвард Х. (1971). «Многокомпонентное ценообразование общественных благ» (PDF) . Общественный выбор . 11 (1): 17–33. DOI : 10.1007 / BF01726210 . JSTOR  30022651 . S2CID  154860771 .
  • Гиббард, Аллан (1973). «Манипуляция схемами голосования: общий результат» (PDF) . Econometrica . 41 (4): 587–601. DOI : 10.2307 / 1914083 . JSTOR  1914083 .
  • Гровс, Теодор (1973). «Поощрения в командах» (PDF) . Econometrica . 41 (4): 617–631. DOI : 10.2307 / 1914085 . JSTOR  1914085 .
  • Харшани, Джон К. (1967). «Игры с неполной информацией, сыгранные« байесовскими »игроками, I-III. Часть I. Базовая модель». Наука управления . 14 (3): 159–182. DOI : 10.1287 / mnsc.14.3.159 . JSTOR  2628393 .
  • Миррлис, Дж. А. (1971). «Исследование теории оптимального налогообложения доходов» (PDF) . Обзор экономических исследований . 38 (2): 175–208. DOI : 10.2307 / 2296779 . JSTOR  2296779 . Архивировано из оригинального (PDF) 10 мая 2017 года . Проверено 12 августа 2016 .
  • Майерсон, Роджер Б .; Саттертуэйт, Марк А. (1983). «Эффективные механизмы двусторонней торговли» (PDF) . Журнал экономической теории . 29 (2): 265–281. DOI : 10.1016 / 0022-0531 (83) 90048-0 .
  • Саттертуэйт, Марк Аллен (1975). «Стратегическая стойкость и условия Эрроу: теоремы существования и соответствия для процедур голосования и функций социального обеспечения». Журнал экономической теории . 10 (2): 187–217. CiteSeerX  10.1.1.471.9842 . DOI : 10.1016 / 0022-0531 (75) 90050-2 .
  • Викри, Уильям (1961). «Противодействие спекуляциям, аукционы и закрытые конкурсные торги» (PDF) . Журнал финансов . 16 (1): 8–37. DOI : 10.1111 / j.1540-6261.1961.tb02789.x .

Дальнейшее чтение [ править ]

  • Глава 7 Фуденберга, Дрю; Тироль, Жан (1991), Теория игр , Бостон: MIT Press , ISBN 978-0-262-06141-4. Стандартный текст для выпускников теории игр.
  • Глава 23 Мас-Колелла ; Уинстон; Грин (1995), Микроэкономическая теория , Оксфорд: Oxford University Press , ISBN 978-0-19-507340-9. Стандартный текст для выпускников по микроэкономике.
  • Милгром, Пол (2004), Применение теории аукционов на практике , Нью-Йорк: Cambridge University Press , ISBN 978-0-521-55184-7. Применение принципов построения механизмов в контексте аукционов.
  • Ноам Нисан . Google технологий говорить о дизайне механизма.
  • Легро, Патрик; Кантильон, Эстель (2007). «Что такое конструкция механизма и почему это важно для разработки политики?» . Центр исследований экономической политики .
  • Роджер Б. Майерсон (2008). «Дизайн механизмов», Новый экономический онлайн-словарь Пэлгрейва, тезисы.
  • Диамантарас, Димитриос (2009), Набор инструментов для экономического дизайна , Нью-Йорк: Palgrave Macmillan , ISBN 978-0-230-61060-6. Выпускной текст специально посвящен конструкции механизмов.

Внешние ссылки [ править ]

  • Эрик Маскин " Лекция о присуждении Нобелевской премии ", прочитанная 8 декабря 2007 г. в Аула Магна , Стокгольмский университет.