Значение Шепли - это концепция решения в теории кооперативных игр . Он был назван в честь Ллойда Шепли , который представил его в 1951 году и получил за него Нобелевскую премию по экономике в 2012 году. [1] [2] Каждой кооперативной игре присваивается уникальное распределение (среди игроков) общего излишка. генерируется коалицией всех игроков. Ценность Шепли характеризуется набором желаемых свойств. Харт (1989) дает обзор этого предмета. [3] [4]
Схема такова: коалиция игроков сотрудничает и получает от этого сотрудничества определенную общую выгоду. Поскольку одни игроки могут вносить больший вклад в коалицию, чем другие, или могут обладать разной переговорной силой (например, угрожая уничтожить весь излишек), какое окончательное распределение образованного излишка между игроками должно возникнуть в каждой конкретной игре? Или иначе говоря: насколько важен каждый игрок для общего сотрудничества и какой выигрыш он или она может ожидать? Значение Шепли дает один из возможных ответов на этот вопрос.
Для игр с разделением затрат с вогнутыми функциями затрат оптимальное правило разделения затрат, которое оптимизирует цену анархии , за которой следует цена стабильности , и есть правило разделения затрат Шепли. [5]
Формальное определение [ править ]
Формально коалиционная игра определяются как: Существует множество N (из п игроков) и функция , которая отображает подмножества игроков действительных числа: с , где обозначает пустое множество. Функция называется характеристической функцией.
Функция имеет следующее значение: если S - коалиция игроков, то ( S ), называемая стоимостью коалиции S , описывает общую ожидаемую сумму выигрышей, которую участники могут получить за счет сотрудничества.
Значение Шепли - это один из способов распределить общую прибыль между игроками, предполагая, что все они сотрудничают. Это «справедливое» распределение в том смысле, что это единственное распределение с определенными желательными свойствами, перечисленными ниже. Согласно значению Шепли, [6] сумма, которую получает игрок i за коалиционную игру, равна
где n - общее количество игроков, а сумма распространяется на все подмножества S из N, не содержащие игрока i . Формулу можно интерпретировать следующим образом: представьте, что коалиция формируется по одному действующему лицу за раз, причем каждый участник требует своего вклада ( S ∪ { i }) - ( S ) в качестве справедливой компенсации, а затем для каждого участника возьмите среднее значение этот вклад по возможным различным перестановкам, в которых может быть сформирована коалиция.
Альтернативная эквивалентная формула для значения Шепли:
где сумма варьируется по всем порядкам игроков и представляет собой набор игроков, в которых предшествуют по порядку . Наконец, это также можно выразить как
что можно интерпретировать как
Примеры [ править ]
Деловой пример [ править ]
Рассмотрим упрощенное описание бизнеса. Владелец o предоставляет критически важный капитал в том смысле, что без него невозможно получить прибыль. Есть m работников w 1 , ..., w m , каждый из которых вносит сумму p в общую прибыль. Позволять
Функция ценности для этой коалиционной игры
где m - мощность . Вычисление значения Шепли для этой коалиционной игры приводит к значениюmp/2 для собственника и п/2для каждого из m рабочих.
Игра с перчатками [ править ]
Игра в перчатках - это коалиционная игра, в которой у игроков есть левая и правая перчатки, а цель состоит в том, чтобы сформировать пары. Позволять
где у игроков 1 и 2 есть перчатки для правой руки, а у игрока 3 - перчатки для левой руки.
Функция ценности для этой коалиционной игры
Формула для расчета значения Шепли:
где R представляет собой упорядочение игроков и есть множество игроков в N , которые предшествуют я в порядке R .
В следующей таблице показаны предельные взносы Игрока 1.
Наблюдать
Аргументом симметрии можно показать, что
Согласно аксиоме эффективности сумма всех значений Шепли равна 1, что означает, что
Свойства [ править ]
Ценность Шепли обладает многими желательными свойствами.
Эффективность [ править ]
Сумма значений Шепли всех агентов равна значению большой коалиции, так что весь выигрыш распределяется между агентами:
Доказательство :
поскольку - телескопическая сумма и имеется | N |! различные упорядоченности R .
Симметрия [ править ]
Если и являются двумя действующими лицами, эквивалентными в том смысле, что
для каждого подмножества из которого не содержит ни ни , а затем .
Это свойство также называется равным обращением с равными .
Линейность [ править ]
Если две коалиционные игры, описываемые функциями выигрыша и объединены, то распределенные выигрыши должны соответствовать выигрышам, полученным из, и выигрышам, полученным из :
за каждый ин . Кроме того , для любого действительного числа ,
за каждый ин .
Нулевой игрок [ править ]
Значение Шепли для нулевого игрока в игре равно нулю. Игрок является нулем в случае для всех коалиций , которые не содержат .
Для данного набора игроков значение Шепли является единственной картой из набора всех игр для векторов выплат, которая удовлетворяет всем четырем свойствам: Эффективность, Симметрия, Линейность, Нулевой игрок.
Автономный тест [ править ]
Если это субаддитивная функция множества , то есть , то для каждого агента : .
Аналогичным образом , если это сверхаддитивна функция множества , то есть , то для каждого агента : .
Таким образом, если кооперация имеет положительные внешние эффекты, все агенты (слабо) выигрывают, а если она имеет отрицательные внешние эффекты, все агенты (слабо) проигрывают. [7] : 147–156
Анонимность [ править ]
Если и - два агента, и - функция усиления, которая идентична, за исключением того, что роли и поменялись местами, то . Это означает, что присвоение ярлыков агентам не играет роли в распределении их доходов.
Маржинализм [ править ]
Значение Шепли можно определить как функцию, которая использует в качестве аргументов только предельный вклад игрока .
Характеристика [ править ]
Значение Шепли не только имеет желаемые свойства, но и является единственным правилом оплаты, удовлетворяющим некоторому подмножеству этих свойств. Например, это единственное правило оплаты, удовлетворяющее четырем свойствам: Эффективность, Симметрия, Линейность и Нулевой игрок. [8] См. [7] : 147–156 для получения дополнительных характеристик.
Значение Ауманна – Шепли [ править ]
В своей книге 1974 года Ллойд Шепли и Роберт Ауманн расширили концепцию значения Шепли на бесконечные игры (определенные относительно неатомарной меры ), создав диагональную формулу. [9] Это было позже расширено Жан-Франсуа Мертенсом и Абрахамом Нейманом .
Как видно выше, ценность игры с участием n человек связывает для каждого игрока ожидание его вклада в ценность или коалицию или игроков перед ним в случайном порядке всех игроков. Когда игроков много и каждый из них играет лишь второстепенную роль, множество всех игроков, предшествующих данному, эвристически считается хорошей выборкой игроков, так что ценность данного бесконечно малого игрока примерно равна «его» вклада в ценность "идеальной" выборки всех игроков.
Символически, если v - функция коалиционной ценности, ассоциирующаяся с каждой коалицией c, измеренное подмножество измеримого множества I, которое можно рассматривать как без потери общности.
где обозначает значение Шепли бесконечно малого игрока ds в игре, tI - идеальный образец множества всех игроков I, содержащего долю t всех игроков, и является коалицией, полученной после того, как ds присоединяется к tI . Это эвристическая форма диагональной формулы .
Предполагая некоторую регулярность функции ценности, например, предполагая, что v может быть представлена как дифференцируемая функция неатомарной меры на I , μ , с функцией плотности с ( характеристической функцией c ). В таких условиях
- ,
как можно показать, аппроксимируя плотность ступенчатой функцией и сохраняя пропорцию t для каждого уровня функции плотности, и
Тогда диагональная формула имеет форму, разработанную Ауманом и Шепли (1974).
Выше μ может быть векторным (если функция определена и дифференцируема в диапазоне μ , приведенная выше формула имеет смысл).
В приведенном выше аргументе, если мера содержит атомы , больше не соответствует действительности - вот почему диагональная формула в основном применяется к неатомным играм.
Для расширения этой диагональной формулы, когда функция f больше не дифференцируема, были применены два подхода . Мертенс возвращается к исходной формуле и берет производную после интеграла, тем самым извлекая выгоду из эффекта сглаживания. Нейман придерживался другого подхода. Возвращаясь к элементарному применению подхода Мертенса из Мертенса (1980): [10]
Это работает, например, для большинства игр, в то время как исходная формула диагонали не может использоваться напрямую. Как Мертенс далее расширяет это, определяя симметрии, относительно которых значение Шепли должно быть инвариантным, и усредняя по таким симметриям, чтобы создать дополнительный эффект сглаживания, коммутируя средние значения с производной операцией, как указано выше. [11] Обзор неатомных ценностей можно найти в Neyman (2002) [12].
Обобщение на коалиции [ править ]
Значение Шепли присваивает значения только отдельным агентам. Он был обобщен [13] для применения к группе агентов C следующим образом:
В машинном обучении [ править ]
Значение Шепли обеспечивает принципиальный способ объяснения предсказаний нелинейных моделей, распространенных в области машинного обучения . Интерпретируя модель, обученную набору характеристик, как функцию ценности для коалиции игроков, значения Шепли обеспечивают естественный способ вычисления того, какие особенности вносят вклад в прогноз. [14] Это объединяет несколько других методов, включая локально интерпретируемые независимые от модели объяснения (LIME), [15] DeepLIFT, [16] и послойное распространение релевантности. [17]
См. Также [ править ]
- Проблема с аэропортом
- Индекс мощности Банцафа
- Индекс силы Шепли – Шубика
Ссылки [ править ]
- ↑ Шепли, Ллойд С. (21 августа 1951 г.). «Заметки об игре для n-лиц - II: Значение игры для n-лиц» (PDF) . Санта-Моника, Калифорния: RAND Corporation.
- ^ Рот, Элвин Э., изд. (1988). Значение Шепли: Очерки в честь Ллойда С. Шепли . Кембридж: Издательство Кембриджского университета. DOI : 10.1017 / CBO9780511528446 . ISBN 0-521-36177-X.
- ^ Харт, Серджиу (1989). «Значение Шепли». В Eatwell, J .; Milgate, M .; Ньюман, П. (ред.). Новый Палгрейв: теория игр . Нортон. С. 210–216. DOI : 10.1007 / 978-1-349-20181-5_25 . ISBN 978-0-333-49537-7.
- ↑ Харт, Серджиу (12 мая 2016 г.). «Библиография совместных игр: теория ценности» .
- ^ Филлипс, Мэтью; Марден, Джейсон Р. (июль 2018 г.). «Компромисс дизайна в вогнутых играх с разделением затрат». IEEE Transactions по автоматическому контролю . 63 (7): 2242–2247. DOI : 10,1109 / tac.2017.2765299 . ISSN 0018-9286 .
- ^ Для доказательства уникального существования см. Ichiishi, Tatsuro (1983). Теория игр для экономического анализа . Нью-Йорк: Academic Press. С. 118–120. ISBN 0-12-370180-5.
- ^ a b Эрве Мулен (2004). Справедливое разделение и коллективное благосостояние . Кембридж, Массачусетс: MIT Press. ISBN 9780262134231.
- ^ Шепли, Ллойд С. (1953). «Ценность игр для n человек». В Kuhn, HW; Такер, AW (ред.). Вклад в теорию игр . Анналы математических исследований. 28 . Издательство Принстонского университета. С. 307–317. DOI : 10.1515 / 9781400881970-018 . ISBN 9781400881970.
- ^ Ауманн, Роберт Дж .; Шепли, Ллойд С. (1974). Ценности неатомных игр . Princeton: Princeton Univ. Нажмите. ISBN 0-691-08103-4.
- ^ Мертенс, Жан-Франсуа (1980). «Стоимость и производные». Математика исследования операций . 5 (4): 523–552. DOI : 10.1287 / moor.5.4.523 . JSTOR 3689325 .
- ^ Мертенс, Жан-Франсуа (1988). «Стоимость Шепли в недифференцируемом случае». Международный журнал теории игр . 17 (1): 1–65. DOI : 10.1007 / BF01240834 .
- ^ Нейман, А., 2002. Ценность игр с бесконечно большим числом игроков, "Справочник теории игр с экономическими приложениями", Справочник по теории игр с экономическими приложениями, Elsevier, издание 1, том 3, номер 3, 00. RJ Aumann & С. Харт (ред.). [1]
- ^ Grabisch, Мишель; Рубенс, Марк (1999). «Аксиоматический подход к концепции взаимодействия игроков в кооперативных играх». Международный журнал теории игр . 28 : 547-565. DOI : 10.1007 / s001820050125 .
- ^ Лундберг, Скотт М .; Ли, Су-Ин. «Единый подход к интерпретации прогнозов модели» . Достижения в системах обработки нейронной информации . 30 : 4765–4774 . Проверено 30 января 2021 .
- ^ Рибейро, Марко Тулио; Сингх, Самир; Гестрин, Карлос (13.08.2016). "Почему я должен тебе доверять?" . Нью-Йорк, Нью-Йорк, США: ACM. DOI : 10.1145 / 2939672.2939778 . ISBN 978-1-4503-4232-2.
- ^ Шрикумар, Avanti; Гринсайд, Пейтон; Кундаже, Аншул (17.07.2017). «Изучение важных функций путем распространения различий в активации» . PMLR . С. 3145–3153. ISSN 2640-3498 . Проверено 30 января 2021 .
- ^ Бах, Себастьян; Биндер, Александр; Монтавон, Грегуар; Клаушен, Фредерик; Мюллер, Клаус-Роберт; Самек, Войцех (10.07.2015). Суарес, Оскар Дениз (ред.). «О пиксельных объяснениях решений нелинейного классификатора путем послойного распространения релевантности» . PLOS ONE . Публичная научная библиотека (PLoS). 10 (7): e0130140. DOI : 10.1371 / journal.pone.0130140 . ISSN 1932-6203 .
Дальнейшее чтение [ править ]
- Фридман, Джеймс У. (1986). Теория игр с приложениями к экономике . Нью-Йорк: Издательство Оксфордского университета. стр. 209 -215. ISBN 0-19-503660-3.
Внешние ссылки [ править ]
- «Величина Шепли» , Математическая энциклопедия , EMS Press , 2001 [1994]
- Калькулятор стоимости Шепли