Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Ллойд Шепли в 2012 году

Значение Шепли - это концепция решения в теории кооперативных игр . Он был назван в честь Ллойда Шепли , который представил его в 1951 году и получил за него Нобелевскую премию по экономике в 2012 году. [1] [2] Каждой кооперативной игре присваивается уникальное распределение (среди игроков) общего излишка. генерируется коалицией всех игроков. Ценность Шепли характеризуется набором желаемых свойств. Харт (1989) дает обзор этого предмета. [3] [4]

Схема такова: коалиция игроков сотрудничает и получает от этого сотрудничества определенную общую выгоду. Поскольку одни игроки могут вносить больший вклад в коалицию, чем другие, или могут обладать разной переговорной силой (например, угрожая уничтожить весь излишек), какое окончательное распределение образованного излишка между игроками должно возникнуть в каждой конкретной игре? Или иначе говоря: насколько важен каждый игрок для общего сотрудничества и какой выигрыш он или она может ожидать? Значение Шепли дает один из возможных ответов на этот вопрос.

Для игр с разделением затрат с вогнутыми функциями затрат оптимальное правило разделения затрат, которое оптимизирует цену анархии , за которой следует цена стабильности , и есть правило разделения затрат Шепли. [5]

Формальное определение [ править ]

Формально коалиционная игра определяются как: Существует множество N (из п игроков) и функция , которая отображает подмножества игроков действительных числа: с , где обозначает пустое множество. Функция называется характеристической функцией.

Функция имеет следующее значение: если S - коалиция игроков, то ( S ), называемая стоимостью коалиции S , описывает общую ожидаемую сумму выигрышей, которую участники могут получить за счет сотрудничества.

Значение Шепли - это один из способов распределить общую прибыль между игроками, предполагая, что все они сотрудничают. Это «справедливое» распределение в том смысле, что это единственное распределение с определенными желательными свойствами, перечисленными ниже. Согласно значению Шепли, [6] сумма, которую получает игрок i за коалиционную игру, равна

где n - общее количество игроков, а сумма распространяется на все подмножества S из N, не содержащие игрока i . Формулу можно интерпретировать следующим образом: представьте, что коалиция формируется по одному действующему лицу за раз, причем каждый участник требует своего вклада ( S ∪ { i }) - ( S ) в качестве справедливой компенсации, а затем для каждого участника возьмите среднее значение этот вклад по возможным различным перестановкам, в которых может быть сформирована коалиция.

Альтернативная эквивалентная формула для значения Шепли:

где сумма варьируется по всем порядкам игроков и представляет собой набор игроков, в которых предшествуют по порядку . Наконец, это также можно выразить как

что можно интерпретировать как

Примеры [ править ]

Деловой пример [ править ]

Рассмотрим упрощенное описание бизнеса. Владелец o предоставляет критически важный капитал в том смысле, что без него невозможно получить прибыль. Есть m работников w 1 , ..., w m , каждый из которых вносит сумму p в общую прибыль. Позволять

Функция ценности для этой коалиционной игры

где m - мощность . Вычисление значения Шепли для этой коалиционной игры приводит к значениюmp/2 для собственника и п/2для каждого из m рабочих.

Игра с перчатками [ править ]

Игра в перчатках - это коалиционная игра, в которой у игроков есть левая и правая перчатки, а цель состоит в том, чтобы сформировать пары. Позволять

где у игроков 1 и 2 есть перчатки для правой руки, а у игрока 3 - перчатки для левой руки.

Функция ценности для этой коалиционной игры

Формула для расчета значения Шепли:

где R представляет собой упорядочение игроков и есть множество игроков в N , которые предшествуют я в порядке R .

В следующей таблице показаны предельные взносы Игрока 1.

Наблюдать

Аргументом симметрии можно показать, что

Согласно аксиоме эффективности сумма всех значений Шепли равна 1, что означает, что

Свойства [ править ]

Ценность Шепли обладает многими желательными свойствами.

Эффективность [ править ]

Сумма значений Шепли всех агентов равна значению большой коалиции, так что весь выигрыш распределяется между агентами:

Доказательство :

поскольку - телескопическая сумма и имеется | N |! различные упорядоченности R .

Симметрия [ править ]

Если и являются двумя действующими лицами, эквивалентными в том смысле, что

для каждого подмножества из которого не содержит ни ни , а затем .

Это свойство также называется равным обращением с равными .

Линейность [ править ]

Если две коалиционные игры, описываемые функциями выигрыша и объединены, то распределенные выигрыши должны соответствовать выигрышам, полученным из, и выигрышам, полученным из :

за каждый ин  . Кроме того , для любого действительного числа ,

за каждый ин  .

Нулевой игрок [ править ]

Значение Шепли для нулевого игрока в игре равно нулю. Игрок является нулем в случае для всех коалиций , которые не содержат .

Для данного набора игроков значение Шепли является единственной картой из набора всех игр для векторов выплат, которая удовлетворяет всем четырем свойствам: Эффективность, Симметрия, Линейность, Нулевой игрок.

Автономный тест [ править ]

Если это субаддитивная функция множества , то есть , то для каждого агента : .

Аналогичным образом , если это сверхаддитивна функция множества , то есть , то для каждого агента : .

Таким образом, если кооперация имеет положительные внешние эффекты, все агенты (слабо) выигрывают, а если она имеет отрицательные внешние эффекты, все агенты (слабо) проигрывают. [7] : 147–156

Анонимность [ править ]

Если и - два агента, и - функция усиления, которая идентична, за исключением того, что роли и поменялись местами, то . Это означает, что присвоение ярлыков агентам не играет роли в распределении их доходов.

Маржинализм [ править ]

Значение Шепли можно определить как функцию, которая использует в качестве аргументов только предельный вклад игрока .

Характеристика [ править ]

Значение Шепли не только имеет желаемые свойства, но и является единственным правилом оплаты, удовлетворяющим некоторому подмножеству этих свойств. Например, это единственное правило оплаты, удовлетворяющее четырем свойствам: Эффективность, Симметрия, Линейность и Нулевой игрок. [8] См. [7] : 147–156 для получения дополнительных характеристик.

Значение Ауманна – Шепли [ править ]

В своей книге 1974 года Ллойд Шепли и Роберт Ауманн расширили концепцию значения Шепли на бесконечные игры (определенные относительно неатомарной меры ), создав диагональную формулу. [9] Это было позже расширено Жан-Франсуа Мертенсом и Абрахамом Нейманом .

Как видно выше, ценность игры с участием n человек связывает для каждого игрока ожидание его вклада в ценность или коалицию или игроков перед ним в случайном порядке всех игроков. Когда игроков много и каждый из них играет лишь второстепенную роль, множество всех игроков, предшествующих данному, эвристически считается хорошей выборкой игроков, так что ценность данного бесконечно малого игрока примерно равна «его» вклада в ценность "идеальной" выборки всех игроков.

Символически, если v - функция коалиционной ценности, ассоциирующаяся с каждой коалицией c, измеренное подмножество измеримого множества I, которое можно рассматривать как без потери общности.

где обозначает значение Шепли бесконечно малого игрока ds в игре, tI - идеальный образец множества всех игроков I, содержащего долю t всех игроков, и является коалицией, полученной после того, как ds присоединяется к tI . Это эвристическая форма диагональной формулы .

Предполагая некоторую регулярность функции ценности, например, предполагая, что v может быть представлена ​​как дифференцируемая функция неатомарной меры на I , μ , с функцией плотности с ( характеристической функцией c ). В таких условиях

,

как можно показать, аппроксимируя плотность ступенчатой ​​функцией и сохраняя пропорцию t для каждого уровня функции плотности, и

Тогда диагональная формула имеет форму, разработанную Ауманом и Шепли (1974).

Выше μ может быть векторным (если функция определена и дифференцируема в диапазоне μ , приведенная выше формула имеет смысл).

В приведенном выше аргументе, если мера содержит атомы , больше не соответствует действительности - вот почему диагональная формула в основном применяется к неатомным играм.

Для расширения этой диагональной формулы, когда функция f больше не дифференцируема, были применены два подхода . Мертенс возвращается к исходной формуле и берет производную после интеграла, тем самым извлекая выгоду из эффекта сглаживания. Нейман придерживался другого подхода. Возвращаясь к элементарному применению подхода Мертенса из Мертенса (1980): [10]

Это работает, например, для большинства игр, в то время как исходная формула диагонали не может использоваться напрямую. Как Мертенс далее расширяет это, определяя симметрии, относительно которых значение Шепли должно быть инвариантным, и усредняя по таким симметриям, чтобы создать дополнительный эффект сглаживания, коммутируя средние значения с производной операцией, как указано выше. [11] Обзор неатомных ценностей можно найти в Neyman (2002) [12].

Обобщение на коалиции [ править ]

Значение Шепли присваивает значения только отдельным агентам. Он был обобщен [13] для применения к группе агентов C следующим образом:

В машинном обучении [ править ]

Значение Шепли обеспечивает принципиальный способ объяснения предсказаний нелинейных моделей, распространенных в области машинного обучения . Интерпретируя модель, обученную набору характеристик, как функцию ценности для коалиции игроков, значения Шепли обеспечивают естественный способ вычисления того, какие особенности вносят вклад в прогноз. [14] Это объединяет несколько других методов, включая локально интерпретируемые независимые от модели объяснения (LIME), [15] DeepLIFT, [16] и послойное распространение релевантности. [17]

См. Также [ править ]

  • Проблема с аэропортом
  • Индекс мощности Банцафа
  • Индекс силы Шепли – Шубика

Ссылки [ править ]

  1. Шепли, Ллойд С. (21 августа 1951 г.). «Заметки об игре для n-лиц - II: Значение игры для n-лиц» (PDF) . Санта-Моника, Калифорния: RAND Corporation.
  2. ^ Рот, Элвин Э., изд. (1988). Значение Шепли: Очерки в честь Ллойда С. Шепли . Кембридж: Издательство Кембриджского университета. DOI : 10.1017 / CBO9780511528446 . ISBN 0-521-36177-X.
  3. ^ Харт, Серджиу (1989). «Значение Шепли». В Eatwell, J .; Milgate, M .; Ньюман, П. (ред.). Новый Палгрейв: теория игр . Нортон. С. 210–216. DOI : 10.1007 / 978-1-349-20181-5_25 . ISBN 978-0-333-49537-7.
  4. Харт, Серджиу (12 мая 2016 г.). «Библиография совместных игр: теория ценности» .
  5. ^ Филлипс, Мэтью; Марден, Джейсон Р. (июль 2018 г.). «Компромисс дизайна в вогнутых играх с разделением затрат». IEEE Transactions по автоматическому контролю . 63 (7): 2242–2247. DOI : 10,1109 / tac.2017.2765299 . ISSN 0018-9286 . 
  6. ^ Для доказательства уникального существования см. Ichiishi, Tatsuro (1983). Теория игр для экономического анализа . Нью-Йорк: Academic Press. С. 118–120. ISBN 0-12-370180-5.
  7. ^ a b Эрве Мулен (2004). Справедливое разделение и коллективное благосостояние . Кембридж, Массачусетс: MIT Press. ISBN 9780262134231.
  8. ^ Шепли, Ллойд С. (1953). «Ценность игр для n человек». В Kuhn, HW; Такер, AW (ред.). Вклад в теорию игр . Анналы математических исследований. 28 . Издательство Принстонского университета. С. 307–317. DOI : 10.1515 / 9781400881970-018 . ISBN 9781400881970.
  9. ^ Ауманн, Роберт Дж .; Шепли, Ллойд С. (1974). Ценности неатомных игр . Princeton: Princeton Univ. Нажмите. ISBN 0-691-08103-4.
  10. ^ Мертенс, Жан-Франсуа (1980). «Стоимость и производные». Математика исследования операций . 5 (4): 523–552. DOI : 10.1287 / moor.5.4.523 . JSTOR 3689325 . 
  11. ^ Мертенс, Жан-Франсуа (1988). «Стоимость Шепли в недифференцируемом случае». Международный журнал теории игр . 17 (1): 1–65. DOI : 10.1007 / BF01240834 .
  12. ^ Нейман, А., 2002. Ценность игр с бесконечно большим числом игроков, "Справочник теории игр с экономическими приложениями", Справочник по теории игр с экономическими приложениями, Elsevier, издание 1, том 3, номер 3, 00. RJ Aumann & С. Харт (ред.). [1]
  13. ^ Grabisch, Мишель; Рубенс, Марк (1999). «Аксиоматический подход к концепции взаимодействия игроков в кооперативных играх». Международный журнал теории игр . 28 : 547-565. DOI : 10.1007 / s001820050125 .
  14. ^ Лундберг, Скотт М .; Ли, Су-Ин. «Единый подход к интерпретации прогнозов модели» . Достижения в системах обработки нейронной информации . 30 : 4765–4774 . Проверено 30 января 2021 .
  15. ^ Рибейро, Марко Тулио; Сингх, Самир; Гестрин, Карлос (13.08.2016). "Почему я должен тебе доверять?" . Нью-Йорк, Нью-Йорк, США: ACM. DOI : 10.1145 / 2939672.2939778 . ISBN 978-1-4503-4232-2.
  16. ^ Шрикумар, Avanti; Гринсайд, Пейтон; Кундаже, Аншул (17.07.2017). «Изучение важных функций путем распространения различий в активации» . PMLR . С. 3145–3153. ISSN 2640-3498 . Проверено 30 января 2021 . 
  17. ^ Бах, Себастьян; Биндер, Александр; Монтавон, Грегуар; Клаушен, Фредерик; Мюллер, Клаус-Роберт; Самек, Войцех (10.07.2015). Суарес, Оскар Дениз (ред.). «О пиксельных объяснениях решений нелинейного классификатора путем послойного распространения релевантности» . PLOS ONE . Публичная научная библиотека (PLoS). 10 (7): e0130140. DOI : 10.1371 / journal.pone.0130140 . ISSN 1932-6203 . 

Дальнейшее чтение [ править ]

  • Фридман, Джеймс У. (1986). Теория игр с приложениями к экономике . Нью-Йорк: Издательство Оксфордского университета. стр.  209 -215. ISBN 0-19-503660-3.

Внешние ссылки [ править ]

  • «Величина Шепли» , Математическая энциклопедия , EMS Press , 2001 [1994]
  • Калькулятор стоимости Шепли