Теорема Спрага – Гранди

В комбинаторной теории игр , в Спрэге-Гранди теорема утверждает , что каждая беспристрастная игра под нормальной игровой конвенцией эквивалентна одной кучи игры NIM , или к бесконечному обобщении NIM. Следовательно, его можно представить как натуральное число , размер кучи в эквивалентной ему игре ним, как порядковое число в бесконечном обобщении, или, альтернативно, как нимбер , значение этой игры с одной кучей в алгебраической системе, чья операция сложения объединяет несколько куч, чтобы сформировать единую эквивалентную кучу в ним.

Гранди значение или NIM-значение любых беспристрастных игр является уникальным Nimber , что игра эквивалентна. В случае игры, позиции которой индексируются натуральными числами (например, сам ним, который индексируется размером его кучи), последовательность нимберов для последовательных позиций в игре называется ним-последовательностью игры.

Теорема Спрэга – Гранди и ее доказательство заключают в себе основные результаты теории, независимо открытой Р.П. Спрагом (1935) ^[1] и П.М. Гранди (1939). ^[2]

Определения

Для целей теоремы Спрага-Гранди игра - это последовательная игра двух игроков с идеальной информацией, удовлетворяющая конечному условию (все игры подходят к концу: нет бесконечных игровых линий) и условию нормальной игры (игрок кто не может двигаться проигрывает).

В любой момент игры позиция игрока - это набор ходов, которые ему разрешено делать. В качестве примера мы можем определить нулевую игру как игру для двух игроков, в которой ни один из игроков не имеет допустимых ходов. Ссылаясь на двух игроков как на ${\ displaystyle A}$ (для Алисы) и ${\ displaystyle B}$ (для Боба) мы бы обозначили их позиции как ${\ Displaystyle (А, В) = (\ {\}, \ {\})}$ , поскольку набор ходов, который может сделать каждый игрок, пуст.

Беспристрастный игра является тот , в котором в любой данный момент в игре, каждый игрок имеет точно такой же набор движений. Нормаль-игра NIM является примером беспристрастных игр. В нем есть одна или несколько куч объектов, и два игрока (назовем их Алиса и Боб) по очереди выбирают кучу и удаляют из нее 1 или несколько объектов. Победителем становится игрок, убравший последний объект из последней кучи. Игра беспристрастна, потому что при любой конфигурации размеров стопки ходы, которые Алиса может делать в свой ход, точно такие же, как Бобу было бы позволено сделать, если бы это был его ход. Напротив, такая игра, как шашки , не является беспристрастной, потому что, предположим, что Алиса играет красным, а Боб - черным, для любого заданного расположения фигур на доске, если бы была очередь Алисы, ей было бы разрешено перемещать только красные фигуры , и если бы настала очередь Боба, ему было бы разрешено двигать только черными фигурами.

Обратите внимание, что любую конфигурацию беспристрастной игры можно записать как одну позицию, потому что ходы будут одинаковыми независимо от того, чей это ход. Например, позицию нулевой игры можно просто записать ${\ Displaystyle \ {\}}$ , потому что, если сейчас очередь Алисы, ей нечего делать, а если сейчас очередь Боба, у него тоже нет ходов. Ход может быть связан с позицией, в которой он оставляет следующего игрока.

Это позволяет рекурсивно определять позиции. Например, рассмотрим следующую игру «Ним», в которую играют Алиса и Боб.

Пример игры Nim

Размеры отвала Ходы ABC   1 2 2 Алиса берет 1 из A 0 2 2 Боб берет 1 у B  0 1 2 Алиса берет 1 из C  0 1 1 Боб берет 1 у B  0 0 1 Алиса берет 1 из C 0 0 0 У Боба нет ходов, поэтому Алиса выигрывает

На шаге 6 игры (когда все кучи пусты) позиция ${\ Displaystyle \ {\}}$ , потому что у Боба нет допустимых ходов. Мы называем эту позицию ${\ displaystyle * 0}$ .
На шаге 5 у Алисы был только один вариант: удалить один объект из кучи C, оставив Боба без ходов. Поскольку ее ход оставляет Боба на месте ${\ displaystyle * 0}$ , ее позиция написана ${\ displaystyle \ {* 0 \}}$ . Мы называем эту позицию ${\ displaystyle * 1}$ .
На шаге 4 у Боба было два варианта: удалить один из B или удалить один из C. Однако обратите внимание, что на самом деле не имело значения, из какой кучи Боб удалил объект: в любом случае у Алисы останется ровно один объект в ровно одна стопка. Итак, используя наше рекурсивное определение, у Боба действительно есть только один ход: ${\ displaystyle * 1}$ . Таким образом, позиция Боба такова. ${\ Displaystyle \ {* 1 \}}$ .
На шаге 3 у Алисы было 3 варианта: удалить два из C, удалить один из C или удалить один из B. Удаление двух из C оставляет Боба на месте. ${\ displaystyle * 1}$ . Удаление одной из C оставляет у Боба две стопки, каждая размером один, т. Е. Положение ${\ Displaystyle \ {* 1 \}}$ , как описано в шаге 4. Однако удаление 1 из B оставит Бобу с двумя объектами в одной стопке. Его движения тогда были бы ${\ displaystyle * 0}$ а также ${\ displaystyle * 1}$ , поэтому ее ход приведет к позиции ${\ displaystyle \ {* 0, * 1 \}}$ . Мы называем эту позицию ${\ displaystyle * 2}$ . Позиция Алисы - это набор всех ее ходов: ${\ displaystyle {\ big \ {} * 1, \ {* 1 \}, * 2 {\ big \}}}$ .
Следуя той же рекурсивной логике, на шаге 2 позиция Боба ${\ displaystyle {\ big \ {} \ {* 1, \ {* 1 \}, * 2 \}, * 2 {\ big \}}}$ .
Наконец, на шаге 1 позиция Алисы равна

${\ displaystyle {\ Big \ {} {\ big \ {} * 1, \ {* 1 \}, * 2 {\ big \}}, {\ big \ {} * 2, \ {* 1, \ { * 1 \}, * 2 \} {\ big \}}, {\ big \ {} \ {* 1 \}, \ {\ {* 1 \} \}, \ {* 1, \ {* 1 \ }, * 2 \} {\ big \}} {\ Big \}}}$ .

Нимберы

Особые имена ${\ displaystyle * 0}$ , ${\ displaystyle * 1}$ , а также ${\ displaystyle * 2}$ упомянутые в нашем примере игры называются « Нимберами» . В общем шустрый ${\ displaystyle * n}$ соответствует позиции в игре ним, где ровно ${\ displaystyle n}$ объекты ровно в одну кучу. Формально нимберы индуктивно определяются следующим образом: ${\ displaystyle * 0}$ является ${\ Displaystyle \ {\}}$ , ${\ Displaystyle * 1 = \ {* 0 \}}$ , ${\ Displaystyle * 2 = \ {* 0, * 1 \}}$ и для всех ${\ Displaystyle п \ geq 0}$ , ${\ Displaystyle * (п + 1) = * п \ чашка \ {* п \}}$ .

Хотя слово NIM бер приходит из игры NIM , nimbers может быть использован для описания положения любого конечного, беспристрастной игры, и в самом деле, Спрэг-Гранди состояния теоремы , что каждый экземпляр конечных, беспристрастная игра может быть связана с одиночка .

Объединение игр

Две игры можно объединить, сложив их позиции вместе. Например, рассмотрим другую игру ним с кучей ${\ displaystyle A '}$ , ${\ displaystyle B '}$ , а также ${\ displaystyle C '}$ .

Пример игры 2

Размеры отвала Ходы A 'B' C '1 1 1 Алиса берет 1 из A '0 1 1 Боб берет один из B '0 0 1 Алиса берет одну из C '0 0 0 У Боба нет ходов, поэтому Алиса выигрывает.

Мы можем объединить это с нашим первым примером, чтобы получить комбинированную игру с шестью кучами: ${\ displaystyle A}$ , ${\ displaystyle B}$ , ${\ displaystyle C}$ , ${\ displaystyle A '}$ , ${\ displaystyle B '}$ , а также ${\ displaystyle C '}$ :

Комбинированная игра

Размеры отвала Ходы ABCA 'B' C '    1 2 2 1 1 1 Алиса берет 1 из A 0 2 2 1 1 1 Боб берет 1 из A ' 0 2 2 0 1 1 Алиса берет 1 из B ' 0 2 2 0 0 1 Боб берет 1 из C ' 0 2 2 0 0 0 Алиса берет 2 из B 0 0 2 0 0 0 Боб берет 2 из C 0 0 0 0 0 0 У Алисы нет ходов, поэтому Боб выигрывает.

Чтобы различать эти две игры, для первого примера мы обозначим его начальную позицию ${\ displaystyle \ color {синий} S}$ и раскрасьте его в синий цвет:

${\ displaystyle \ color {blue} S = {\ Big \ {} {\ big \ {} * 1, \ {* 1 \}, * 2 {\ big \}}, {\ big \ {} * 2, \ {* 1, \ {* 1 \}, * 2 \} {\ big \}}, {\ big \ {} \ {* 1 \}, \ {\ {* 1 \} \}, \ {* 1, \ {* 1 \}, * 2 \} {\ big \}} {\ Big \}}}$

Во втором примере игры мы обозначим начальную позицию ${\ displaystyle \ color {красный} S '}$ и раскрасьте его в красный цвет:

${\ displaystyle \ color {красный} S '= {\ Big \ {} \ {* 1 \} {\ Big \}}}$ .

Чтобы вычислить начальную позицию комбинированной игры , помните, что игрок может сделать ход в первой игре, оставив вторую игру нетронутой, или сделать ход во второй игре, оставив первую игру нетронутой. Итак, стартовая позиция комбинированной игры:

${\ displaystyle \ color {синий} S \ color {черный} + \ color {красный} S '\ color {черный} = {\ Big \ {} \ color {синий} S \ color {черный} + \ color {красный } \ {* 1 \} \ color {black} {\ Big \}} \ cup {\ Big \ {} \ color {red} S '\ color {black} + \ color {blue} \ {* 1, \ {* 1 \}, * 2 \} \ color {black}, \ color {red} S '\ color {black} + \ color {blue} \ {* 2, \ {* 1, \ {* 1 \} , * 2 \} \} \ color {black}, \ color {red} S '\ color {black} + \ color {blue} \ {\ {* 1 \}, \ {\ {* 1 \} \} , \ {* 1, \ {* 1 \}, * 2 \} \} \ color {черный} {\ Big \}}}$

Явная формула для добавления позиций: ${\ Displaystyle S + S '= \ {S + s' \ mid s '\ in S' \} \ cup \ {s + S '\ mid s \ in S \}}$ , что означает, что сложение одновременно коммутативно и ассоциативно.

Эквивалентность

Позиции в беспристрастных играх делятся на два класса исходов : либо побеждает следующий игрок (тот, чья очередь идет) ( ${\ displaystyle {\ boldsymbol {\ mathcal {N}}}}$ - позиция ), либо предыдущий игрок побеждает (a ${\ displaystyle {\ boldsymbol {\ mathcal {P}}}}$ - положение ). Так, например, ${\ displaystyle * 0}$ это ${\ displaystyle {\ mathcal {P}}}$ -позиция, а ${\ displaystyle * 1}$ является ${\ Displaystyle {\ mathcal {N}}}$ -должность.

Две позиции ${\ displaystyle G}$ а также ${\ displaystyle G '}$ являются эквивалентными , если, независимо от того , какой позиции ${\ displaystyle H}$ добавляется к ним, они всегда находятся в одном классе результатов. Формально, ${\ Displaystyle G \ приблизительно G '}$ если и только если ${\ displaystyle \ forall H}$ , ${\ displaystyle G + H}$ находится в том же классе результатов, что и ${\ displaystyle G '+ H}$ .

Чтобы использовать наши рабочие примеры, обратите внимание, что как в первой, так и во второй играх, описанных выше, мы можем показать, что на каждом ходу Алиса делает ход, который заставляет Боба ${\ displaystyle {\ mathcal {P}}}$ -должность. Таким образом, оба ${\ displaystyle \ color {синий} S}$ а также ${\ displaystyle \ color {красный} S '}$ находятся ${\ Displaystyle {\ mathcal {N}}}$ -позиции. (Обратите внимание, что в комбинированной игре Боб является игроком с ${\ Displaystyle {\ mathcal {N}}}$ -позиции. По факту, ${\ displaystyle \ color {синий} S \ color {черный} + \ color {красный} S '}$ это ${\ displaystyle {\ mathcal {P}}}$ -положение, которое, как мы увидим в лемме 2, означает ${\ Displaystyle \ цвет {синий} S \ цвет {черный} \ приблизительно \ цвет {красный} S '}$ .)

Первая лемма

В качестве промежуточного шага к доказательству основной теоремы покажем, что для каждой позиции ${\ displaystyle G}$ и каждый ${\ displaystyle {\ mathcal {P}}}$ -должность ${\ displaystyle A}$ , эквивалентность ${\ Displaystyle G \ приблизительно A + G}$ держит. По приведенному выше определению эквивалентности это означает, что ${\ displaystyle G + H}$ а также ${\ displaystyle A + G + H}$ поделиться классом результатов для всех ${\ displaystyle H}$ .

Предположим, что ${\ displaystyle G + H}$ это ${\ displaystyle {\ mathcal {P}}}$ -должность. Тогда у предыдущего игрока есть выигрышная стратегия для ${\ displaystyle A + G + H}$ : реагировать на шаги в ${\ displaystyle A}$ в соответствии с их выигрышной стратегией для ${\ displaystyle A}$ (который существует в силу ${\ displaystyle A}$ быть ${\ displaystyle {\ mathcal {P}}}$ -позиция) и реагировать на движения в ${\ displaystyle G + H}$ в соответствии с их выигрышной стратегией для ${\ displaystyle G + H}$ (который существует по аналогичной причине). Так ${\ displaystyle A + G + H}$ также должен быть ${\ displaystyle {\ mathcal {P}}}$ -должность.

С другой стороны, если ${\ displaystyle G + H}$ является ${\ Displaystyle {\ mathcal {N}}}$ -позиция, то ${\ displaystyle A + G + H}$ также ${\ Displaystyle {\ mathcal {N}}}$ -позиция, потому что у следующего игрока есть выигрышная стратегия: выберите ${\ displaystyle {\ mathcal {P}}}$ -позиция из числа ${\ displaystyle G + H}$ варианты, и мы делаем вывод из предыдущего абзаца, что добавление ${\ displaystyle A}$ на эту позицию по-прежнему ${\ displaystyle {\ mathcal {P}}}$ -должность. Таким образом, в этом случае ${\ displaystyle A + G + H}$ должен быть ${\ Displaystyle {\ mathcal {N}}}$ -позиция, как и ${\ displaystyle G + H}$ .

Поскольку это только два случая, лемма верна.

Вторая лемма.

В качестве дальнейшего шага покажем, что ${\ Displaystyle G \ приблизительно G '}$ если и только если ${\ Displaystyle G + G '}$ это ${\ displaystyle {\ mathcal {P}}}$ -должность.

В прямом направлении предположим, что ${\ Displaystyle G \ приблизительно G '}$ . Применяя определение эквивалентности с ${\ displaystyle H = G}$ , мы находим, что ${\ displaystyle G '+ G}$ (что равно ${\ Displaystyle G + G '}$ от коммутативности сложения) находится в том же классе , как итоговый ${\ displaystyle G + G}$ . Но ${\ displaystyle G + G}$ должен быть ${\ displaystyle {\ mathcal {P}}}$ -позиция: за каждый сделанный ход в одном экземпляре ${\ displaystyle G}$ , предыдущий игрок может ответить тем же ходом в другой копии, и поэтому всегда будет делать последний ход.

В обратном направлении, поскольку ${\ displaystyle A = G + G '}$ это ${\ displaystyle {\ mathcal {P}}}$ -позиция по условию следует из первой леммы, ${\ Displaystyle G \ приблизительно G + A}$ , что ${\ Displaystyle G \ приблизительно G + (G + G ')}$ . Аналогично, поскольку ${\ displaystyle B = G + G}$ также ${\ displaystyle {\ mathcal {P}}}$ -позиции следует из первой леммы в виде ${\ Displaystyle G '\ приблизительно G' + B}$ что ${\ Displaystyle G '\ приблизительно G' + (G + G)}$ . По ассоциативности и коммутативности правые части этих результатов равны. Более того, ${\ Displaystyle \ приблизительно}$ является отношением эквивалентности, потому что равенство является отношением эквивалентности для классов результатов. Через транзитивности из ${\ Displaystyle \ приблизительно}$ , можно сделать вывод, что ${\ Displaystyle G \ приблизительно G '}$ .

Доказательство

Мы доказываем, что все позиции эквивалентны нимберу, методом структурной индукции . Более конкретный результат, что начальная позиция данной игры должна быть эквивалентна нимберу, показывает, что сама игра эквивалентна нимберу.

Рассмотрим позицию ${\ Displaystyle G = \ {G_ {1}, G_ {2}, \ ldots, G_ {k} \}}$ . По предположению индукции, все варианты эквивалентны нимберам, скажем, ${\ displaystyle G_ {i} \ приблизительно * n_ {i}}$ . Так что давайте ${\ displaystyle G '= \ {* n_ {1}, * n_ {2}, \ ldots, * n_ {k} \}}$ . Мы покажем, что ${\ Displaystyle G \ приблизительно * м}$ , где ${\ displaystyle m}$ это мексика (минимальное исключение) чисел ${\ displaystyle n_ {1}, n_ {2}, \ ldots, n_ {k}}$ , то есть наименьшее целое неотрицательное число, не равное некоторому ${\ displaystyle n_ {i}}$ .

Первое, что нам нужно отметить, это то, что ${\ Displaystyle G \ приблизительно G '}$ , согласно второй лемме. Если ${\ displaystyle k}$ равен нулю, утверждение тривиально верно. В противном случае рассмотрите ${\ Displaystyle G + G '}$ . Если следующий игрок делает ход на ${\ displaystyle G_ {i}}$ в ${\ displaystyle G}$ , то предыдущий игрок может перейти на ${\ displaystyle * n_ {i}}$ в ${\ displaystyle G '}$ , и наоборот, если следующий игрок сделает ход в ${\ displaystyle G '}$ . После этого позиция становится ${\ displaystyle {\ mathcal {P}}}$ -позиция по прямой импликации леммы. Следовательно, ${\ Displaystyle G + G '}$ это ${\ displaystyle {\ mathcal {P}}}$ -позиция, и, ссылаясь на обратную импликацию леммы, ${\ Displaystyle G \ приблизительно G '}$ .

Теперь покажем, что ${\ displaystyle G '+ * m}$ это ${\ displaystyle {\ mathcal {P}}}$ -позиция, что, еще раз используя вторую лемму, означает, что ${\ Displaystyle G '\ приблизительно * м}$ . Мы делаем это, давая явную стратегию предыдущему игроку.

Предположим, что ${\ displaystyle G '}$ а также ${\ displaystyle * m}$ пусты. потом ${\ displaystyle G '+ * m}$ является нулевым набором, очевидно, ${\ displaystyle {\ mathcal {P}}}$ -должность.

Или рассмотрим случай, когда следующий игрок перемещается в компоненте ${\ displaystyle * m}$ к варианту ${\ displaystyle * m '}$ где ${\ displaystyle m '}>$ . Так как ${\ displaystyle m}$ было минимальным исключенным числом, предыдущий игрок может перейти в ${\ displaystyle G '}$ к ${\ displaystyle * m '}$ . И, как было показано ранее, любая позиция плюс сама по себе является ${\ displaystyle {\ mathcal {P}}}$ -должность.

Наконец, предположим, что следующий игрок перемещается в компоненте ${\ displaystyle G '}$ к варианту ${\ displaystyle * n_ {i}}$ . Если ${\ displaystyle n_ {i} }>$ тогда предыдущий игрок переходит в ${\ displaystyle * m}$ к ${\ displaystyle * n_ {i}}$ ; в противном случае, если ${\ displaystyle n_ {i}> m}$ , предыдущий игрок заходит ${\ displaystyle * n_ {i}}$ к ${\ displaystyle * m}$ ; в любом случае результат - это позиция плюс сама себя. (Это невозможно, чтобы ${\ displaystyle n_ {i} = m}$ так как ${\ displaystyle m}$ был определен как отличный от всех ${\ displaystyle n_ {i}}$ .)

Таким образом, у нас есть ${\ Displaystyle G \ приблизительно G '}$ а также ${\ Displaystyle G '\ приблизительно * м}$ . По транзитивности заключаем, что ${\ Displaystyle G \ приблизительно * м}$ , по желанию.

Разработка

Если ${\ displaystyle G}$ позиция беспристрастной игры, единственное целое число ${\ displaystyle m}$ такой, что ${\ Displaystyle G \ приблизительно * м}$ называется его значением Гранди или числом Гранди, а функция, которая присваивает это значение каждой такой позиции, называется функцией Спрага – Гранди. Р.Л. Спраг и П.М. Гранди независимо друг от друга дали явное определение этой функции, не основанное на какой-либо концепции эквивалентности ним позиций, и показали, что она обладает следующими свойствами:

Ценность Гранди одной кучи ним размером ${\ displaystyle m}$ (т.е. позиции ${\ displaystyle * m}$ ) является ${\ displaystyle m}$ ;
Позиция - это проигрыш для следующего игрока (т. Е. ${\ displaystyle {\ mathcal {P}}}$ -position) тогда и только тогда, когда его значение Grundy равно нулю; а также
Значение Гранди суммы конечного набора позиций - это всего лишь ним-сумма значений Гранди его слагаемых.

Из этих результатов прямо следует, что если позиция ${\ displaystyle G}$ имеет значение Гранди, равное ${\ displaystyle m}$ , тогда ${\ displaystyle G + H}$ имеет то же значение Гранди, что и ${\ displaystyle * m + H}$ , и, следовательно, принадлежит к одному классу результатов для любой позиции ${\ displaystyle H}$ . Таким образом, хотя Спраг и Гранди никогда явно не формулировали теорему, описанную в этой статье, она непосредственно следует из их результатов и им приписывается. ^[3]^[4] Эти результаты впоследствии были развиты в области комбинаторной теории игр , в частности Ричардом Гаем , Элвином Берлекэмпом , Джоном Хортоном Конвеем и другими, где они теперь заключены в теорему Спрэга – Гранди и ее доказательство в форма описана здесь. Поле представлено в книгах « Выигрышные способы для ваших математических игр» и « О числах и играх» .

Смотрите также

Внешние ссылки

Игра Гранди на пороге
Легко читаемый вводный отчет от математического факультета Калифорнийского университета в Лос-Анджелесе
Игра Нима на sputsoft.com
Milvang-Jensen, Brit CA (2000), Комбинаторные игры, теория и приложения (PDF) , CiteSeerX 10.1.1.89.805

[SpraguePaper-1] Перейти ↑ Sprague, RP (1935–36). "Uber Mathematische Kampfspiele" . Математический журнал Тохоку . 41 : 438–444.

[GrundyPaper-2] Гранди, PM (1939). «Математика и игры» . Эврика . 2 : 6–8. Архивировано из оригинала на 2007-09-27.Перепечатано, 1964 г., 27 : 9–11.

[3] Смит, Седрик А.Б. (1960), «Патрик Майкл Гранди, 1917–1959», Журнал Королевского статистического общества, серия A , 123 (2): 221–22

[4] Шлейхер, Дирк; Столл, Майкл (2006). «Введение в игры и числа Конвея». Московский математический журнал . 6 (2): 359–388. arXiv : math.CO/0410026 . DOI : 10.17323 / 1609-4514-2006-6-2-359-388 .

[1]