Проектирование механизмов - это область экономики и теории игр, в которой используется подход , ориентированный на цели, при разработке экономических механизмов или стимулов для достижения желаемых целей в стратегических условиях , когда игроки действуют рационально . Поскольку она начинается в конце игры, а затем идет в обратном направлении, ее также называют теорией обратной игры . Он имеет широкое применение, начиная от экономики и политики в таких областях , как дизайн рынка , теории аукционов и теории общественного выбора к сетевым-системам (интернет междоменной маршрутизации, авторы поиска аукционов).
При проектировании механизмов изучаются концепции решений для класса приватно-информационных игр. Леонид Гурвич объясняет, что «в задаче проектирования целевая функция является главной« данностью », а механизм - неизвестным. Таким образом, проблема проектирования является «обратной» традиционной экономической теории, которая обычно посвящена анализу работы данного механизма ». [1] Итак, две отличительные особенности этих игр:
- что "дизайнер" игры выбирает структуру игры, а не наследует ее
- что дизайнер заинтересован в исходе игры
Нобелевская мемориальная премия по экономическим наукам 2007 года была присуждена Леониду Гурвицу , Эрику Маскину и Роджеру Майерсону «за то, что они заложили основы теории конструкции механизмов». [2]
Интуиция
В интересном классе байесовских игр один игрок, называемый «принципалом», хотел бы обусловить свое поведение информацией, которая в частном порядке известна другим игрокам. Например, директор хочет знать истинное качество подержанной машины, которую продает продавец. Он ничего не может узнать, просто спросив продавца, потому что в его интересах исказить истину. Однако в разработке механизмов у принципала есть одно преимущество: он может разработать игру, правила которой могут повлиять на других, чтобы они действовали так, как он хотел.
Без теории конструкции механизмов проблему директора было бы трудно решить. Ему придется рассмотреть все возможные игры и выбрать ту, которая лучше всего влияет на тактику других игроков. Кроме того, доверитель должен будет делать выводы от агентов, которые могут ему лгать. Благодаря конструкции механизма и, в частности, принципу раскрытия информации , принципал должен учитывать только те игры, в которых агенты правдиво сообщают свою личную информацию.
Фонды
Механизм
Игра в разработку механизмов - это игра с частной информацией, в которой один из агентов, называемый принципалом, выбирает структуру выплаты. Следуя Харшани ( 1967 ), агенты получают секретные «сообщения» от природы, содержащие информацию, относящуюся к выплатам. Например, сообщение может содержать информацию об их предпочтениях или качестве товара для продажи. Мы называем эту информацию "типом" агента (обычно отмечается и соответственно пространство типов ). Затем агенты сообщают о типе принципала (обычно отмечается шляпой).), что может быть стратегической ложью. После отчета принципалу и агентам выплачиваются выплаты в соответствии со структурой выплат, выбранной принципалом.
Время игры:
- Принципал подчиняется механизму что дает результат как функция сообщаемого типа
- Агенты сообщают, возможно, нечестно, типовой профиль
- Механизм выполнен (агенты получают результат )
Чтобы понять, кто что получает, принято делить результат на размещение товаров и перевод денег, где обозначает распределение предоставленных или полученных товаров в зависимости от типа, и означает денежный перевод как функцию от типа.
В качестве эталона дизайнер часто определяет, что произойдет, если будет полная информация. Определитьфункция общественного выбора отображение (истинного) профиля типа непосредственно на распределение полученных или предоставленных товаров,
Напротив, механизм сопоставляет отчетный профиль типа с результатом (опять же, как распределение товаров и денежный перевод )
Принцип откровения
Предлагаемый механизм представляет собой байесовскую игру (игру частной информации), и при правильном ее использовании игра имеет байесовское равновесие по Нэшу . В состоянии равновесия агенты выбирают свои отчеты стратегически в зависимости от типа
В таких условиях трудно найти байесовское равновесие, потому что оно включает в себя поиск стратегий наилучшего реагирования агентов и наилучший вывод из возможной стратегической лжи. Благодаря широкому результату, называемому принципом откровения, независимо от механизма, разработчик может [3] ограничить внимание равновесием, в котором агенты правдиво сообщают о типе. Принцип откровения гласит: «Каждому байесовскому равновесию по Нэшу соответствует байесовская игра с таким же исходом равновесия, но в которой игроки правдиво сообщают о типе».
Это очень полезно. Этот принцип позволяет найти байесовское равновесие, предполагая, что все игроки правдиво сообщают тип (с учетом ограничения совместимости стимулов ). Одним ударом он избавляет от необходимости рассматривать либо стратегическое поведение, либо ложь.
Его доказательство вполне прямое. Допустим, байесовская игра, в которой стратегия и выигрыш агента являются функциями его типа и того, что делают другие,. По определению равновесная стратегия агента i Нэш в ожидаемой полезности:
Просто определите механизм, который побудит агентов выбрать одно и то же равновесие. Проще всего определить механизм, обязывающий играть за них равновесные стратегии агентов .
При таком механизме агенты, конечно, считают оптимальным выявление типа, поскольку механизм все равно использует стратегии, которые они сочли оптимальными. Формально выбираем такой, что
Реализуемость
Разработчик механизма обычно надеется либо
- разработать механизм который «реализует» функцию социального выбора
- найти механизм который максимизирует некоторый критерий ценности (например, прибыль)
Для реализации функции социального выбора найти некоторые передаточная функция, которая мотивирует агентов выбирать . Формально, если профиль стратегии равновесия в рамках механизма соответствует тому же распределению товаров, что и функция общественного выбора,
мы говорим, что механизм реализует функцию социального выбора.
Благодаря принципу откровенности конструктор обычно может найти передаточную функцию реализовать социальный выбор, решив связанную с ним игру по правдивости. Если агенты сочтут оптимальным правдиво сообщать о типе,
мы говорим, что такой механизм действительно реализуем (или просто «реализуем»). Тогда задача состоит в том, чтобы решить правдиво реализуемуюи приписать эту передаточную функцию исходной игре. Распределение действительно реализуемо, если существует передаточная функция такой, что
которое также называется ограничением совместимости стимулов (IC).
В приложениях условие IC является ключом к описанию формы любым полезным способом. При определенных условиях он может даже аналитически выделить передаточную функцию. Кроме того, иногда добавляется ограничение на участие ( индивидуальная рациональность ), если агенты имеют возможность не играть.
Необходимость
Рассмотрим ситуацию, в которой все агенты имеют функцию полезности, зависящую от типа. . Учитывайте также распределение товаров то есть векторнозначный и размер (что позволяет количество товаров) и предположим, что он кусочно-непрерывен по своим аргументам.
Функция реализуем, только если
в любое время а также и x непрерывен в. Это необходимое условие, которое выводится из условий первого и второго порядка задачи оптимизации агента в предположении правдивости.
Его значение можно понять из двух частей. Первая часть говорит о том, что предельная скорость замещения агента (MRS) увеличивается в зависимости от типа,
Короче говоря, агенты не скажут правду, если механизм не предлагает более выгодные условия для агентов более высокого уровня. В противном случае более высокие типы, столкнувшись с любым механизмом, который наказывает высокие типы за сообщение, будут лгать и объявлять, что они являются низшими типами, нарушая ограничение IC правдивости. Вторая часть - это условие монотонности, ожидающее своего появления,
что, если быть положительным, означает, что более высоким типам нужно давать больше добра.
У этих двух частей есть потенциал для взаимодействия. Если для некоторого диапазона типов контракт предлагал меньшее количество для более высоких типов, возможно, механизм мог бы компенсировать это, предоставив более высокие типы скидки. Но такой договор уже существует для низкотипных агентов, поэтому это решение патологическое. Такое решение иногда возникает в процессе поиска механизма. В этих случаях его необходимо « погладить ». В среде с нескольких исправными также возможно для дизайнера наградить агент с более одного товаром для замены меньше других (например , масло для маргарина ). Множественные хорошие механизмы - постоянная проблема в теории проектирования механизмов.
Достаточность
Документы по разработке механизмов обычно делают два допущения для обеспечения возможности реализации:
Это известно под несколькими названиями: условие однократного пересечения, условие сортировки и условие Спенса – Миррлиза. Это означает, что функция полезности имеет такую форму, что тип MRS агента увеличивается.
Это техническое условие, ограничивающее темпы роста MRS.
Этих предположений достаточно, чтобы любая монотонная реализуема (a существует, который может его реализовать). Кроме того, в настройке с одним хорошим условием однократного перехода достаточно, чтобы обеспечить только монотонный реализуема, поэтому дизайнер может ограничить свой поиск монотонным .
Выделенные результаты
Теорема об эквивалентности доходов
Викри ( 1961 ) дает знаменитый результат, заключающийся в том, что любой участник большого класса аукционов гарантирует продавцу такой же ожидаемый доход и что ожидаемый доход - лучшее, что может сделать продавец. Это так, если
- Покупатели имеют идентичные оценочные функции (которые могут зависеть от типа).
- Типы покупателей распределяются независимо
- Типы покупателей выбираются из непрерывного распределения
- Распределение типов имеет свойство монотонной степени опасности.
- Механизм продает товар покупателю с наивысшей оценкой.
Последнее условие является ключевым для теоремы. Подразумевается, что для того, чтобы продавец получил более высокий доход, он должен рискнуть и передать товар агенту с более низкой оценкой. Обычно это означает, что он должен рискнуть вообще не продавать предмет.
Механизмы Викри – Кларка – Гровса
Модель аукциона Викри (1961) была позже расширена Кларком ( 1971 ) и Гроувсом для решения проблемы общественного выбора, в которой расходы на общественный проект несут все агенты, например, строить ли муниципальный мост. Получающийся в результате механизм «Викри-Кларка-Гроувса» может мотивировать агентов выбирать социально эффективное распределение общественного блага, даже если агенты имеют частно известные оценки. Другими словами, он может разрешить « трагедию общин » - при определенных условиях, в частности, при квазилинейной полезности или если не требуется баланс бюджета.
Рассмотрим обстановку, в которой количество агентов имеет квазилинейную полезность с частными оценками где валюта оценивается линейно. Дизайнер VCG разрабатывает механизм, совместимый со стимулами (следовательно, правдиво реализуемый), для получения истинного профиля типа, из которого разработчик реализует социально оптимальное распределение.
Умный механизм VCG - это то, как он мотивирует правдивое откровение. Это устраняет стимулы к искажению информации, наказывая любого агента ценой искажения, которое он вызывает. Среди отчетов, которые может сделать агент, механизм VCG допускает «нулевой» отчет, в котором говорится, что он безразличен к общественному благу и заботится только о переводе денег. Это эффективно удаляет агента из игры. Если агент выбирает тип сообщения, механизм VCG взимает с агента плату, если его отчет является ключевым , то есть если его отчет изменяет оптимальное распределение x, чтобы нанести вред другим агентам. Оплата рассчитывается
который суммирует искажения полезности других агентов (а не его собственные), вызванные отчетом одного агента.
Теорема Гиббарда – Саттертуэйта.
Гиббард ( 1973 ) и Саттертуэйт ( 1975 ) приводят результат о невозможности, аналогичный по духу теореме о невозможности Эрроу . Для очень общего класса игр могут быть реализованы только «диктаторские» функции социального выбора.
Функция общественного выбора f () является диктаторской, если один агент всегда получает наиболее предпочтительное распределение благ,
Теорема утверждает, что в общих условиях любая реально реализуемая функция общественного выбора должна быть диктаторской, если:
- X конечно и содержит не менее трех элементов
- Предпочтения рациональны
Теорема Майерсона – Саттертуэйта
Майерсон и Саттертуэйт ( 1983 ) показывают, что для двух сторон не существует эффективного способа торговать товаром, если каждая из них имеет секретные и вероятностно разные оценки, без риска вынудить одну сторону торговать в убыток. Это один из самых замечательных отрицательных результатов в экономике - своего рода отрицательное зеркало фундаментальных теорем экономики благосостояния .
Примеры
Ценовая дискриминация
Миррлис ( 1971 ) вводит настройку, в которой передаточную функцию t () легко найти . Из-за своей актуальности и управляемости это обычное дело в литературе. Рассмотрим настройку с одним хорошим и одним агентом, в которой агент имеет квазилинейную утилиту с параметром неизвестного типа.
и в котором принципал имеет более раннюю CDF по сравнению с типом агента. Принципал может производить товары с выпуклой предельной стоимостью c ( x ) и хочет максимизировать ожидаемую прибыль от сделки.
в соответствии с условиями IC и IR
Принципал здесь - монополист, пытающийся установить максимальную прибыль ценовую схему, в которой он не может определить тип клиента. Типичный пример - это авиакомпания, устанавливающая тарифы для деловых людей, туристов и студентов. Из-за условия IR он должен дать каждому типу достаточно хорошую сделку, чтобы привлечь к участию. Из-за условия IC он должен давать каждому типу достаточно хорошую сделку, чтобы этот тип предпочел эту сделку сделке любого другого.
Уловка, предложенная Миррлисом (1971), состоит в том, чтобы использовать теорему об огибающей, чтобы исключить передаточную функцию из ожидания максимизации,
Интеграция,
где это некоторый тип индекса. Замена совместимого со стимулом в максимуме,
после интеграции по частям. Эта функция может быть максимизирована поточечно.
Так как уже совместим со стимулами, разработчик может отказаться от ограничения IC. Если функция полезности удовлетворяет условию Спенса – Миррлиса, то монотонныйфункция существует. Ограничение IR можно проверить в состоянии равновесия и соответственно увеличить или уменьшить график сборов. Кроме того, обратите внимание на наличие в выражении степени опасности . Если распределение типов обладает свойством монотонного отношения рисков, FOC достаточно для решения для t (). Если нет, то необходимо проверить, выполняется ли ограничение монотонности (см. Выше достаточность ) повсюду в графиках распределения и сборов. Если нет, то дизайнер должен использовать глажку Майерсона.
Майерсон гладильная
В некоторых приложениях разработчик может решить условия первого порядка для графиков цен и распределения, но обнаружит, что они не являются монотонными. Например, в квазилинейной настройке это часто происходит, когда отношение рисков само по себе не является монотонным. Согласно условию Спенса-Миррлиса оптимальные графики цен и распределения должны быть монотонными, поэтому разработчик должен исключить любой интервал, в течение которого график меняет направление, сглаживая его.
Наглядно, что происходит это дизайнер считает оптимальным сгусток определенных типов вместе и дают им один и тот же контракт. Обычно дизайнер мотивирует более высокие типы выделиться, предлагая им более выгодную сделку. Если количество более высоких типов на марже недостаточно, разработчик не считает целесообразным предоставлять более низким типам уступку (так называемую информационную ренту ), чтобы взимать более высокие типы по контракту, зависящему от типа.
Рассмотрим принципала-монополиста, продающего агентам с квазилинейной полезностью, как в примере выше. Предположим, что график распределения удовлетворяющие условиям первого порядка, имеет единственный внутренний пик на и единственное внутреннее корыто на , показано справа.
- Следуя Майерсону (1981), сгладьте его, выбрав удовлетворение
- где - функция, обратная к отображению x в а также - функция, обратная к отображению x в . Это, возвращает перед внутренним пиком и возвращает после интерьерного корыта.
- Если немонотонная область граничит с краем текстового поля, просто установите соответствующий функция (или обе) к типу границы. Если есть несколько регионов, см. Учебник для итеративной процедуры; может случиться так, что нужно гладить более одной кормушки вместе.
Доказательство
Доказательство использует теорию оптимального управления. Считает набор интервалов в немонотонной области из-за чего это может сгладить график. Затем он пишет гамильтониан, чтобы получить необходимые условия для в промежутках
- что удовлетворяет монотонность
- для которых ограничение монотонности не связывает границы интервала
Условие два гарантирует, что удовлетворяющая задаче оптимального управления воссоединяется с расписанием исходной задачи на границах интервала (без скачков). Любой удовлетворяющее необходимым условиям, должно быть плоским, потому что оно должно быть монотонным и все же повторно соединяться на границах.
Как и прежде, максимизировать ожидаемый выигрыш от принципала, но на этот раз с учетом ограничения монотонности
и использовать для этого гамильтониан с теневой ценой
где переменная состояния и контроль. Как обычно при оптимальном управлении, уравнение эволюции затрат должно удовлетворять
Воспользовавшись условием 2, обратите внимание, что ограничение монотонности не является обязательным на границах интервал
означает, что условие переменной стоимости может быть интегрировано и также равно 0
Среднее искажение профицита основного капитала должно быть 0. Чтобы сгладить график, найдите таким образом, что его прообраз отображается в интервал, удовлетворяющий вышеуказанному условию.
Смотрите также
- Разработка алгоритмического механизма
- Элвин Э. Рот - Нобелевская премия, дизайн рынка
- Проблема с присвоением
- Теория договора
- Теория реализации
- Поощрительная совместимость
- Принцип откровения
- Умный рынок
- Метагейм
Заметки
- ^ L. Hurwicz & S. Reiter (2006) Разработка экономических механизмов , стр. 30
- ^ "Премия Sveriges Riksbank в области экономических наук в память об Альфреде Нобеле 2007" (пресс-релиз). Нобелевский фонд . 15 октября 2007 . Проверено 15 августа 2008 .
- ^ В необычных обстоятельствах некоторые игры, говорящие о правде, имеют больше равновесий, чем байесовские игры, из которых они составили карту. См. Fudenburg-Tirole Ch. 7.2 для некоторых ссылок.
Рекомендации
- Кларк, Эдвард Х. (1971). «Многокомпонентное ценообразование на общественные блага» (PDF) . Общественный выбор . 11 (1): 17–33. DOI : 10.1007 / BF01726210 . JSTOR 30022651 . S2CID 154860771 .
- Гиббард, Аллан (1973). «Манипулирование схемами голосования: общий результат» (PDF) . Econometrica . 41 (4): 587–601. DOI : 10.2307 / 1914083 . JSTOR 1914083 .
- Гровс, Теодор (1973). «Поощрения в командах» (PDF) . Econometrica . 41 (4): 617–631. DOI : 10.2307 / 1914085 . JSTOR 1914085 .
- Харшани, Джон К. (1967). «Игры с неполной информацией, сыгранные« байесовскими »игроками, I-III. Часть I. Базовая модель». Наука управления . 14 (3): 159–182. DOI : 10.1287 / mnsc.14.3.159 . JSTOR 2628393 .
- Миррлис, Дж. А. (1971). «Исследование теории оптимального налогообложения доходов» (PDF) . Обзор экономических исследований . 38 (2): 175–208. DOI : 10.2307 / 2296779 . JSTOR 2296779 . Архивировано из оригинального (PDF) 10 мая 2017 года . Проверено 12 августа 2016 .
- Майерсон, Роджер Б .; Саттертуэйт, Марк А. (1983). «Эффективные механизмы двусторонней торговли» (PDF) . Журнал экономической теории . 29 (2): 265–281. DOI : 10.1016 / 0022-0531 (83) 90048-0 . hdl : 10419/220829 .
- Саттертуэйт, Марк Аллен (1975). «Стратегическая стойкость и условия Эрроу: теоремы существования и соответствия для процедур голосования и функций социального обеспечения». Журнал экономической теории . 10 (2): 187–217. CiteSeerX 10.1.1.471.9842 . DOI : 10.1016 / 0022-0531 (75) 90050-2 .
- Викри, Уильям (1961). «Противодействие спекуляциям, аукционы и закрытые конкурсные торги» (PDF) . Журнал финансов . 16 (1): 8–37. DOI : 10.1111 / j.1540-6261.1961.tb02789.x .
дальнейшее чтение
- Глава 7 Фуденберг, Дрю; Тироль, Жан (1991), Теория игр , Бостон: MIT Press , ISBN 978-0-262-06141-4. Стандартный текст для выпускников теории игр.
- Глава 23 Мас-Колелл ; Уинстон; Грин (1995), Микроэкономическая теория , Оксфорд: Oxford University Press , ISBN 978-0-19-507340-9. Стандартный текст для выпускников по микроэкономике.
- Милгром, Пол (2004), Применение теории аукционов на практике , Нью-Йорк: Cambridge University Press , ISBN 978-0-521-55184-7. Применение принципов построения механизмов в контексте аукционов.
- Ноам Нисан . Google технологий говорить о дизайне механизма.
- Легро, Патрик; Кантильон, Эстель (2007). «Что такое конструкция механизма и почему это важно для разработки политики?» . Центр исследований экономической политики .
- Роджер Б. Майерсон (2008). «Дизайн механизмов», Новый экономический онлайн-словарь Пэлгрейва, тезисы.
- Диамантарас, Димитриос (2009), Набор инструментов для экономического дизайна , Нью-Йорк: Palgrave Macmillan , ISBN 978-0-230-61060-6. Выпускной текст специально посвящен конструкции механизмов.
Внешние ссылки
- Эрик Маскин « Лекция о присуждении Нобелевской премии », прочитанная 8 декабря 2007 г. в Аула Магна , Стокгольмский университет.