В линейной алгебре , то теорема Кэлей-Гамильтон (названная в честь математиков Кэлей и Уильям Роуэн Гамильтон ) гласит , что каждая квадратная матрица над коммутативным кольцом (такие как реальное или сложным поле ) удовлетворяет свое собственное характеристическое уравнение .
Если является заданная п × п матрица и я п является п × п единичная матрица , то характеристический полином из А определяется как [7] , где det - детерминантная операция, а λ - переменная для скалярного элемента базового кольца. Поскольку элементы матрицыявляются (линейными или константой) многочленов от Л , определитель также п -го порядка унитарного многочлена в λ , Можно создать аналогичный многочлен в матрице A вместо скалярной переменной λ , определяемой какТеорема Кэли – Гамильтона утверждает, что этот многочлен приводит к нулевой матрице , то есть. Теорема позволяет п быть выражено в виде линейной комбинации низших матричных степеней A . Когда кольцо является полем, теорема Кэли – Гамильтона эквивалентна утверждению, что минимальный многочлен квадратной матрицы делит ее характеристический многочлен. Теорема была впервые доказана в 1853 г. [8] в терминах обратных линейных функций кватернионов , некоммутативного кольца, Гамильтоном. [4] [5] [6] Это соответствует частному случаю некоторых вещественных матриц размером 4 × 4 или комплексных матриц 2 × 2 . Теорема верна для общих кватернионных матриц. [9] [nb 1] Кэли в 1858 г. сформулировал это для матриц 3 × 3 и меньше, но опубликовал доказательство только для случая 2 × 2 . [2] Общий случай был впервые доказан Фердинандом Фробениусом в 1878 году. [10]
Примеры
Матрицы 1 × 1
Для матрицы A = ( a 1,1 ) размером 1 × 1 характеристический многочлен равен p (λ) = λ - a , поэтому p ( A ) = ( a ) - a 1,1 = 0 тривиально.
2 × 2 матрицы
В качестве конкретного примера пусть
Его характеристический полином дается выражением
Теорема Кэли – Гамильтона утверждает, что если мы определим
тогда
Мы можем проверить вычислением, что действительно
Для общей матрицы 2 × 2 ,
характеристический полином равен p ( λ ) = λ 2 - ( a + d ) λ + ( ad - bc ) , поэтому теорема Кэли – Гамильтона утверждает, что
что действительно всегда так, что становится очевидным после обработки записей A 2 .
Приложения
Определитель и обратная матрица
Для общего п × п обратимой матрицы А , то есть, один с ненулевой определитель, А -1 , таким образом , может быть записана в виде ( п - 1) -го порядка полиномиального выражения в A : Как указано, Кэли-Гамильтона теорема сводится к тому личность
Коэффициенты гр I задаются элементарных симметрических многочленов от собственных значений А . Используя тождества Ньютона , элементарные симметричные многочлены, в свою очередь, могут быть выражены через степенные суммы симметричных многочленов собственных значений:
где tr ( A k ) - след матрицы A k . Таким образом, мы можем выразить с I в терминах следа степеней A .
В общем, формула для коэффициентов c i задается в терминах полных экспоненциальных многочленов Белла как [nb 2]
В частности, определитель A равен (-1) n c 0 . Таким образом, определитель можно записать как тождество трассы :
Точно так же характеристический многочлен можно записать как
и, умножая обе части на A −1 (примечание - (- 1) n = (−1) n −1 ), мы получаем выражение для обратного к A в качестве тождества следа,
Другой метод получения этих коэффициентов c k для общей матрицы размера n × n , при условии, что ни один корень не равен нулю, основан на следующем альтернативном выражении для определителя :
Следовательно, в силу ряда Меркатора ,
где экспоненциальные только потребности быть расширены до порядка Й - п , так как р ( Х ) имеет порядок п , чистые отрицательные степени Х автоматически нуля по теореме о С-Н. (Опять же, для этого требуется кольцо, содержащее рациональные числа.) Дифференцирование этого выражения по λ позволяет выразить коэффициенты характеристического полинома для общего n как определители матриц размера m × m , [nb 3]
- Примеры
Например, первые несколько полиномов Белла: B 0 = 1, B 1 ( x 1 ) = x 1 , B 2 ( x 1 , x 2 ) = x2
1+ x 2 и B 3 ( x 1 , x 2 , x 3 ) = x3
1+ 3 х 1 х 2 + х 3 .
Используя их для задания коэффициентов c i характеристического полинома матрицы 2 × 2, получаем
Коэффициент c 0 дает определитель матрицы 2 × 2 , c 1 минус ее след, а его обратный равен
Из общей формулы для c n-k , выраженной через полиномы Белла, очевидно , что выражения
всегда дают коэффициенты c n −1 при λ n −1 и c n −2 при λ n −2 в характеристическом полиноме любой матрицы размера n × n , соответственно. Итак, для матрицы A 3 × 3 утверждение теоремы Кэли – Гамильтона также можно записать как
где правая часть обозначает матрицу 3 × 3, все элементы которой сведены к нулю. Точно так же этот определитель в случае n = 3 теперь равен
Это выражение дает отрицательное значение коэффициента c n −3 при λ n −3 в общем случае, как показано ниже.
Точно так же можно написать для матрицы A 4 × 4 ,
где теперь определитель c n −4 ,
и так далее для матриц большего размера. Все более сложные выражения для коэффициентов c k выводятся из тождеств Ньютона или алгоритма Фаддеева – Леверье .
n -я степень матрицы
Теорема Кэли – Гамильтона всегда обеспечивает связь между степенями A (хотя и не всегда простейшую), что позволяет упростить выражения, включающие такие степени, и вычислить их без необходимости вычислять степень A n или любые более высокие степени A .
Например, для теорема дает
Затем, чтобы вычислить A 4 , наблюдайте
Так же,
Обратите внимание, что мы смогли записать степень матрицы как сумму двух членов. Фактически, степень матрицы любого порядка k может быть записана как матричный полином степени не выше n - 1 , где n - размер квадратной матрицы. Это случай, когда теорему Кэли – Гамильтона можно использовать для выражения матричной функции, которую мы систематически обсудим ниже.
Матричные функции
Учитывая аналитическую функцию
и характеристический полином р ( х ) степени п из в N × N матрицы A , функция может быть выражена с помощью длинного деления , как
где q ( x ) - некоторый фактор-полином, а r ( x ) - полином остатка такой, что 0 ≤ deg r ( x ) < n .
По теореме Кэли – Гамильтона замена x матрицей A дает p ( A ) = 0 , поэтому
Таким образом, аналитическая функция матрицы A может быть выражена как матричный полином степени меньше n .
Пусть полином остатка равен
Поскольку p ( λ ) = 0 , вычисление функции f ( x ) на n собственных значениях матрицы A дает
Это составляет систему из n линейных уравнений, которые можно решить для определения коэффициентов c i . Таким образом, есть
Когда собственные значения повторяются, то есть λ i = λ j для некоторого i ≠ j , два или более уравнения идентичны; и, следовательно, линейные уравнения не могут быть решены однозначно. Для таких случаев для собственного значения λ с кратностью m первые m - 1 производные p (x) обращаются в нуль в собственном значении. Это приводит к дополнительным m - 1 линейно независимым решениям
которые вместе с другими дают необходимые n уравнений для решения относительно c i .
Нахождение многочлена, проходящего через точки ( λ i , f ( λ i )), по сути, является проблемой интерполяции и может быть решено с использованием методов интерполяции Лагранжа или Ньютона , что приводит к формуле Сильвестра .
Например, предположим, что задача состоит в том, чтобы найти полиномиальное представление
Характеристический многочлен р ( х ) = ( х - 1) ( х - 3) = х 2 - 4 х + 3 , а собственные значения Х = 1, 3 . Пусть r ( x ) = c 0 + c 1 x . Вычисляя f ( λ) = r ( λ ) в собственных значениях, получаем два линейных уравнения: e t = c 0 + c 1 и e 3 t = c 0 + 3 c 1 .
Решение уравнений дает c 0 = (3 e t - e 3 t ) / 2 и c 1 = ( e 3 t - e t ) / 2 . Таким образом, следует, что
Если бы вместо этого функция была f ( A ) = sin At , тогда коэффициенты были бы c 0 = (3 sin t - sin 3 t ) / 2 и c 1 = (sin 3 t - sin t ) / 2 ; следовательно
В качестве еще одного примера при рассмотрении
тогда характеристический многочлен p ( x ) = x 2 + 1 , а собственные значения λ = ± i .
Как и раньше, вычисление функции по собственным значениям дает нам линейные уравнения e it = c 0 + ic 1 и e - it = c 0 - ic 1 ; решение которого дает c 0 = ( e it + e - it ) / 2 = cos t и c 1 = ( e it - e - it ) / 2 i = sin t . Таким образом, в этом случае
которая является матрицей вращения .
Стандартные примеры такого использования является экспоненциальным отображением из алгебры Ли в виде матричной группы Ли в группу. Он задается матричной экспонентой ,
Такие выражения давно известны для SU (2) ,
где σ являются матрицы Паули и для SO (3) ,
что является формулой вращения Родригеса . Обозначения см. В группе вращений SO (3) # Замечание по алгебре Ли .
Совсем недавно выражения появились для других групп, таких как группа Лоренца SO (3, 1) , [11] O (4, 2) [12] и SU (2, 2) , [13], а также GL ( n , R ) . [14] В группе O (4, 2) является конформной группой из пространства - времени , SU (2, 2) его просто соединена крышка (чтобы быть точными, односвязном крышка подключенного компонента SO + (4, 2) из O (4, 2) ). Полученные выражения применимы к стандартному представлению этих групп. Они требуют знания (некоторых) собственных значений матрицы для возведения в степень. Для SU (2) (а значит, и для SO (3) ) получены замкнутые выражения для всех неприводимых представлений, т. Е. Любого спина. [15]
Алгебраическая теория чисел
Теорема Кэли – Гамильтона - эффективный инструмент для вычисления минимального многочлена от целых алгебраических чисел. Например, учитывая конечное расширение из и целое алгебраическое число что является ненулевой линейной комбинацией мы можем вычислить минимальный многочлен от найдя матрицу, представляющую -линейное преобразование
Если мы назовем эту матрицу преобразования , то мы можем найти минимальный многочлен, применяя теорему Кэли – Гамильтона к . [16]
Доказательства
Теорема Кэли – Гамильтона является непосредственным следствием существования жордановой нормальной формы для матриц над алгебраически замкнутыми полями . В этом разделе представлены прямые доказательства.
Как показывают приведенные выше примеры, получение утверждения теоремы Кэли – Гамильтона для матрицы размера n × n
требует двух шагов: сначала коэффициенты c i характеристического полинома определяются разверткой как полином по t определителя
а затем эти коэффициенты используются в линейной комбинации степеней A, которая приравнивается к нулевой матрице n × n :
Боковая левая рука может быть выработана к п × п матрицы, элементы которой являются (огромные) полиномиальные выражения в наборе записей я , J из А , так Кэли-Гамильтона теорема утверждает , что каждый из этих п 2 выражения равных 0 . Для любого фиксированного значения n эти тождества могут быть получены путем утомительных, но простых алгебраических манипуляций. Однако ни одно из этих вычислений не может показать, почему теорема Кэли – Гамильтона должна быть верной для матриц всех возможных размеров n , поэтому требуется единообразное доказательство для всех n .
Предварительные мероприятия
Если вектор v размера п является собственным вектором из А с собственным значением λ , другими словами , если A ⋅ v = λv , то
который является вектором нуль , так как р ( λ ) = 0 (собственные значения А именно те корни из р ( т ) ). Это верно для всех возможных собственных значений λ , поэтому две матрицы, приравненные теоремой, безусловно, дают одинаковый (нулевой) результат при применении к любому собственному вектору. Теперь , если допускает базис из собственных векторов, других слова , если является диагонализируемо , то Кэли-Гамильтон теорема должен быть выполнен для А , так как две матрицы , которые дают то же значение , когда применяются к каждому элементу основы должна быть равны.
- произведение собственных значений
Рассмотрим теперь функцию который отображает матрицы для матрицы, заданные формулой , т.е. которая принимает матрицу и вставляет его в собственный характеристический многочлен. Не все матрицы диагонализуемы, но для матриц с комплексными коэффициентами многие из них: набордиагонализуемая комплексная квадратная матрица заданного размера плотна во множестве всех таких квадратных матриц [17] (для диагонализуемости матрицы достаточно, например, чтобы ее характеристический многочлен не имел кратных корней). Теперь рассматривается как функция(поскольку матрицы имеют записей) мы видим, что эта функция непрерывна . Это верно, потому что элементы изображения матрицы задаются полиномами в элементах матрицы. С
и поскольку множество плотно, по непрерывности эта функция должна отображать все множество матрицы к нулевой матрице. Следовательно, теорема Кэли – Гамильтона верна для комплексных чисел и, следовательно, должна также выполняться для- или же -значные матрицы.
Хотя это обеспечивает действительное доказательство, аргумент не очень удовлетворителен, поскольку тождества, представленные теоремой, никоим образом не зависят от природы матрицы (диагонализуемой или нет), ни от типа разрешенных элементов (для матриц с вещественные элементы (диагонализуемые) не образуют плотного множества, и кажется странным, что пришлось бы рассматривать комплексные матрицы, чтобы увидеть, что для них выполняется теорема Кэли – Гамильтона). Поэтому сейчас мы будем рассматривать только аргументы, которые доказывают теорему непосредственно для любой матрицы, используя только алгебраические манипуляции; они также имеют то преимущество, что работают с матрицами с элементами в любом коммутативном кольце .
Существует множество таких доказательств теоремы Кэли – Гамильтона, некоторые из которых будут приведены здесь. Они различаются количеством абстрактных алгебраических понятий, необходимых для понимания доказательства. В простейших доказательствах используются только те понятия, которые необходимы для формулировки теоремы (матрицы, многочлены с числовыми элементами, определители), но используются технические вычисления, которые делают несколько загадочным тот факт, что они приводят именно к правильному выводу. Можно избежать таких деталей, но за счет использования более тонких алгебраических понятий: многочлены с коэффициентами в некоммутативном кольце или матрицы с необычными типами элементов.
Сопрягать матрицы
Во всех приведенных ниже доказательствах используется понятие сопряженной матрицы adj ( M ) к матрице M размера n × n , транспонированной матрицы ее кофакторов .
Это матрица, коэффициенты которой задаются полиномиальными выражениями от коэффициентов матрицы M (фактически, некоторыми определителями ( n - 1) × ( n - 1) ) таким образом, что выполняются следующие фундаментальные соотношения:
Эти соотношения являются прямым следствием основных свойств определителей: оценка элемента ( i , j ) матричного произведения слева дает расширение по столбцу j определителя матрицы, полученной из M заменой столбца i на копия столбца j , который является det ( M ), если i = j, и нулем в противном случае; матричное произведение справа аналогично, но для разложения по строкам.
Будучи следствием простой манипуляции с алгебраическими выражениями, эти соотношения действительны для матриц с элементами в любом коммутативном кольце (для определения определителей в первую очередь необходимо предполагать коммутативность). Это важно отметить здесь, потому что эти отношения будут применяться ниже для матриц с нечисловыми элементами, такими как полиномы.
Прямое алгебраическое доказательство
В этом доказательстве используются именно те объекты, которые необходимы для формулировки теоремы Кэли – Гамильтона: матрицы с полиномами в качестве элементов. Матрица t I n - A , определитель которой является характеристическим многочленом матрицы A, является такой матрицей, и, поскольку многочлены образуют коммутативное кольцо, она имеет сопряженный
Тогда согласно правому фундаментальному соотношению сопряженного элемента имеем
Поскольку B также является матрицей с полиномами от t в качестве элементов, для каждого i можно собрать коэффициенты t i в каждой записи, чтобы сформировать матрицу B i чисел, так что один имеет
(Из того, как определены элементы B , ясно, что не встречаются степени выше t n −1 ). Хотя это выглядит как многочлен с матрицами в качестве коэффициентов, мы не будем рассматривать такое понятие; это просто способ записать матрицу с полиномиальными элементами как линейную комбинацию n постоянных матриц, а коэффициент t i был записан слева от матрицы, чтобы подчеркнуть эту точку зрения.
Теперь можно разложить матричное произведение в нашем уравнении на билинейность
Письмо
получается равенство двух матриц с полиномиальными элементами, записанными как линейные комбинации постоянных матриц со степенями t в качестве коэффициентов.
Такое равенство может иметь место только в том случае, если в любой позиции матрицы запись, умноженная на заданную степень t i, одинакова с обеих сторон; Отсюда следует, что постоянные матрицы с коэффициентом t i в обоих выражениях должны быть равны. Записывая эти уравнения затем для i от n до 0, можно найти
Наконец, умножьте уравнение коэффициентов t i слева на A i и просуммируйте:
Левые части образуют телескопическую сумму и полностью сокращаются; правые части складываются в:
Это завершает доказательство.
Доказательство с использованием многочленов с матричными коэффициентами
Это доказательство аналогично первому, но пытается придать смысл понятию полинома с матричными коэффициентами, которое было предложено выражениями, встречающимися в этом доказательстве. Это требует особой осторожности, поскольку несколько необычно рассматривать многочлены с коэффициентами в некоммутативном кольце, и не все рассуждения, которые справедливы для коммутативных многочленов, могут быть применены в этой ситуации.
Примечательно, что в то время как арифметика многочленов над коммутативным кольцом моделирует арифметику полиномиальных функций , это не относится к некоммутативному кольцу (фактически, в этом случае нет очевидного понятия полиномиальной функции, которая замкнута относительно умножения). Таким образом, при рассмотрении полиномов от t с матричными коэффициентами переменная t не должна рассматриваться как «неизвестная», а как формальный символ, которым следует управлять в соответствии с заданными правилами; в частности, нельзя просто установить t на определенное значение.
Позволять быть кольцом матрицы с записями в некотором кольце R (например, действительными или комплексными числами), имеющим A в качестве элемента. Матрицы с полиномами в качестве коэффициентов от t , напримерили его адъюгат B в первом доказательстве, являются элементами.
Собирая одинаковые степени t , такие матрицы можно записать как «полиномы» от t с постоянными матрицами в качестве коэффициентов; написатьдля множества таких многочленов. Поскольку это множество находится в биекции с, на нем соответственно определяются арифметические операции, в частности умножение задается формулой
соблюдение порядка матриц коэффициентов из двух операндов; очевидно, это дает некоммутативное умножение.
Таким образом, тождество
из первого доказательства можно рассматривать как доказательство, включающее умножение элементов в .
На этом этапе возникает соблазн просто установить t равным матрице A , что делает первый множитель слева равным нулевой матрице, а правую часть - равным p ( A ) ; однако это недопустимая операция, когда коэффициенты не коммутируются. Можно определить «карту правой оценки» ЭВ A : M [ т ] → M , который заменяет каждый т я матрица мощности А я из А , где один оговаривает , что власть всегда будет умножена на праве к соответствующему коэффициенту.
Но это отображение не является гомоморфизмом колец: правая оценка произведения в целом отличается от произведения правых оценок. Это так, потому что умножение многочленов на матричные коэффициенты не моделирует умножение выражений, содержащих неизвестные: произведениеопределяется в предположении , что т коммутирует с N , но это может потерпеть неудачу , если т заменяется на матрицу A .
Эту трудность можно обойти в конкретной ситуации, поскольку указанное выше отображение правой оценки действительно становится кольцевым гомоморфизмом, если матрица A находится в центре кольца коэффициентов, так что она коммутирует со всеми коэффициентами многочленов (аргумент, доказывающий это, прост, именно потому, что коммутация t с коэффициентами теперь оправдана после оценки).
Теперь A не всегда находится в центре M , но мы можем заменить M кольцом меньшего размера, если оно содержит все коэффициенты рассматриваемых многочленов:, A , а коэффициентымногочлена B . Очевидный выбор для такого подкольцу является центратор Z из А , подкольцо всех матриц, коммутирующих с А ; по определению находится в центре Z .
Этот централизатор, очевидно, содержит , и A , но нужно показать, что он содержит матрицы. Для этого нужно объединить два фундаментальных соотношения для адъюгатов, выписав адъюгат B в виде полинома:
Приравнивание коэффициентов показывает, что для каждого i мы имеем A B i = B i A, как и нужно . Найдя подходящие условия, в которых ev A действительно является гомоморфизмом колец, можно завершить доказательство, как было предложено выше:
Это завершает доказательство.
Синтез первых двух доказательств
В первом доказательстве, один был в состоянии определить коэффициенты B I из B на основе правой фундаментального соотношения для только adjugate. На самом деле первые п полученных уравнения можно интерпретировать как определение фактора - B в евклидове деления многочлена р ( т ) я п слева от унитарного многочлена I н т - А , в то время как окончательное уравнение выражает тот факт , что остаток равен нулю. Это деление выполняется в кольце многочленов с матричными коэффициентами. В самом деле, даже над некоммутативным кольцом евклидово деление на монический многочлен P определено и всегда дает однозначное частное и остаток с тем же условием степени, что и в коммутативном случае, при условии, что указано, с какой стороны нужно, чтобы P. быть фактором (здесь он слева).
Чтобы убедиться, что частное и остаток уникальны (что является важной частью утверждения здесь), достаточно написать в виде и заметим, что поскольку P моничен, P (Q − Q ') не может иметь степень меньше, чем у P , если Q = Q' .
Но используемые здесь делимое p ( t ) I n и делитель I n t - A лежат в подкольце ( R [ A ]) [ t ] , где R [ A ] - подкольцо кольца матриц M ( n , R ) , порожденный A : R -линейной оболочка всех степеней A . Следовательно, евклидово деление на самом деле может быть выполнено внутри этого коммутативного кольца многочленов, и, конечно, тогда оно дает такое же частное B и остаток 0, что и в большем кольце; в частности, это показывает, что B на самом деле лежит в ( R [ A ]) [ t ] .
Но в этой коммутативной настройке допустимо установить t равным A в уравнении
другими словами, чтобы применить оценочную карту
который является гомоморфизмом колец, что дает
как и во втором доказательстве, по желанию.
В дополнении к доказательству теоремы, приведенное рассуждение говорит нам о том , что коэффициенты B I из B являются многочленами А , а из второго доказательства мы только знали , что они лежат в централизаторном Z от A ; в общем случае Z является подкольцом большего размера, чем R [ A ] , и не обязательно коммутативным. В частности, постоянный член B 0 = adj (- A ) лежит в R [ A ] . Поскольку A - произвольная квадратная матрица, это доказывает, что adj ( A ) всегда может быть выражен как полином от A (с коэффициентами, которые зависят от A ) .
Фактически уравнения, найденные в первом доказательстве, позволяют последовательно выразить как многочлены от A , что приводит к тождеству
справедливо для всех матриц размера n × n , где
является характеристическим полиномом A .
Обратите внимание, что из этого тождества также следует утверждение теоремы Кэли – Гамильтона: можно переместить adj (- A ) в правую часть, умножить полученное уравнение (слева или справа) на A и использовать тот факт, что
Доказательство с использованием матриц эндоморфизмов
Как было упомянуто выше, матрица р ( ) в формулировке теоремы получается первой оценкой детерминанта , а затем заменяя матрицу А для т ; делая эту замену в матрицуперед оценкой определителя не имеет смысла. Тем не менее, можно дать интерпретацию, в которой p ( A ) получается непосредственно как значение определенного определителя, но это требует более сложной настройки, одной из матриц над кольцом, в которой можно интерпретировать обе записииз А , и все А сам. Для этого можно взять кольцо M ( n , R ) матриц размера n × n над R , где запись реализуется как , и A как себя. Но рассмотрение матриц с матрицами в качестве элементов может вызвать путаницу с блочными матрицами , что не предназначено, поскольку это дает неправильное понятие определителя (напомним, что определитель матрицы определяется как сумма произведений ее элементов, а в случае блочной матрицы это обычно не то же самое, что соответствующая сумма произведений ее блоков!). Это яснее , чтобы отличить А от эндоморфизма ф о с п - мерного векторным пространством V (или свободного R - модуль , если R не является поле) , определенными им в качестве основы, и взять матрицы над кольцом End ( V ) всех таких эндоморфизмов. Тогда φ ∈ End ( V ) - возможный элемент матрицы, а A обозначает элемент M ( n , End ( V )) , элемент i , j которого является эндоморфизмом скалярного умножения на; по аналогиибудет интерпретироваться как элемент M ( n , End ( V )). Однако, поскольку End ( V ) не является коммутативным кольцом, на M ( n , End ( V )) не определен определитель ; это можно сделать только для матриц над коммутативным подкольцом End ( V ). Теперь элементы матрицывсе лежат в подкольце R [ φ ], порожденном единицей и φ , которое коммутативно. Тогда определено детерминантное отображение M ( n , R [ φ ]) → R [ φ ] ивычисляет значение p ( φ ) характеристического полинома A в точке φ (это выполняется независимо от отношения между A и φ ); теорема Кэли – Гамильтона утверждает, что p ( φ ) является нулевым эндоморфизмом.
В этой форме следующее доказательство может быть получено из доказательства (Atiyah & MacDonald 1969 , Prop. 2.4) (которое на самом деле является более общим утверждением, связанным с леммой Накаямы ; в этом предложении за идеал берется все кольцо R ). Тот факт, что A - матрица функции φ в базисе e 1 , ..., e n, означает, что
Их можно интерпретировать как n компонентов одного уравнения в V n , члены которого могут быть записаны с использованием произведения матрица-вектор M ( n , End ( V )) × V n → V n , которое определяется как обычно, но с отдельными элементами ψ ∈ End ( V ) и v в V "умножаются" путем формирования; это дает:
где - это элемент, компонент i которого равен e i (другими словами, это базис e 1 , ..., e n матрицы V, записанный как столбец векторов). Записывая это уравнение как
узнается транспонирование матрицы considered above, and its determinant (as element of M(n, R[φ])) is also p(φ). To derive from this equation that p(φ) = 0 ∈ End(V), one left-multiplies by the adjugate matrix of , which is defined in the matrix ring M(n, R[φ]), giving
the associativity of matrix-matrix and matrix-vector multiplication used in the first step is a purely formal property of those operations, independent of the nature of the entries. Now component i of this equation says that p(φ)(ei) = 0 ∈ V; thus p(φ) vanishes on all ei, and since these elements generate V it follows that p(φ) = 0 ∈ End(V), completing the proof.
One additional fact that follows from this proof is that the matrix A whose characteristic polynomial is taken need not be identical to the value φ substituted into that polynomial; it suffices that φ be an endomorphism of V satisfying the initial equations
for some sequence of elements e1,...,en that generate V (which space might have smaller dimension than n, or in case the ring R is not a field it might not be a free module at all).
A bogus "proof": p(A) = det(AIn − A) = det(A − A) = 0
One persistent elementary but incorrect argument[18] for the theorem is to "simply" take the definition
and substitute A for λ, obtaining
There are many ways to see why this argument is wrong. First, in Cayley–Hamilton theorem, p(A) is an n×n matrix. However, the right hand side of the above equation is the value of a determinant, which is a scalar. So they cannot be equated unless n = 1 (i.e. A is just a scalar). Second, in the expression , the variable λ actually occurs at the diagonal entries of the matrix . To illustrate, consider the characteristic polynomial in the previous example again:
If one substitutes the entire matrix A for λ in those positions, one obtains
in which the "matrix" expression is simply not a valid one. Note, however, that if scalar multiples of identity matrices instead of scalars are subtracted in the above, i.e. if the substitution is performed as
then the determinant is indeed zero, but the expanded matrix in question does not evaluate to ; nor can its determinant (a scalar) be compared to p(A) (a matrix). So the argument that still does not apply.
Actually, if such an argument holds, it should also hold when other multilinear forms instead of determinant is used. For instance, if we consider the permanent function and define , then by the same argument, we should be able to "prove" that q(A) = 0. But this statement is demonstrably wrong. In the 2-dimensional case, for instance, the permanent of a matrix is given by
So, for the matrix A in the previous example,
Yet one can verify that
One of the proofs for Cayley–Hamilton theorem above bears some similarity to the argument that . By introducing a matrix with non-numeric coefficients, one can actually let A live inside a matrix entry, but then is not equal to A, and the conclusion is reached differently.
Proofs using methods of abstract algebra
Basic properties of Hasse–Schmidt derivations on the exterior algebra of some B-module M (supposed to be free and of finite rank) have been used by Gatto & Salehyan (2016, §4) to prove the Cayley–Hamilton theorem. See also Gatto & Scherbak (2015).
Абстракция и обобщения
The above proofs show that the Cayley–Hamilton theorem holds for matrices with entries in any commutative ring R, and that p(φ) = 0 will hold whenever φ is an endomorphism of an R module generated by elements e1,...,en that satisfies
This more general version of the theorem is the source of the celebrated Nakayama lemma in commutative algebra and algebraic geometry.
Смотрите также
- Companion matrix
Замечания
- ^ Due to the non-commutative nature of the multiplication operation for quaternions and related constructions, care needs to be taken with definitions, most notably in this context, for the determinant. The theorem holds as well for the slightly less well-behaved split-quaternions, see Alagös, Oral & Yüce (2012). The rings of quaternions and split-quaternions can both be represented by certain 2 × 2 complex matrices. (When restricted to unit norm, these are the groups SU(2) and SU(1, 1) respectively.) Therefore it is not surprising that the theorem holds.
There is no such matrix representation for the octonions, since the multiplication operation is not associative in this case. However, a modified Cayley–Hamilton theorem still holds for the octonions, see Tian (2000). - ^ An explicit expression for these coefficients is
- ^ See, e.g., p. 54 of Brown 1994, which solves Jacobi's formula,
- ( Hou 1998), and the above recursions, in turn.
Заметки
- ^ a b Crilly 1998
- ^ a b Cayley 1858, pp. 17–37
- ^ Cayley 1889, pp. 475–496
- ^ a b Hamilton 1864a
- ^ a b Hamilton 1864b
- ^ a b Hamilton 1862
- ^ Atiyah & MacDonald 1969
- ^ Hamilton 1853, p. 562
- ^ Zhang 1997
- ^ a b Frobenius 1878
- ^ Zeni & Rodrigues 1992
- ^ Barut, Zeni & Laufer 1994a
- ^ Barut, Zeni & Laufer 1994b
- ^ Laufer 1997
- ^ Curtright, Fairlie & Zachos 2014
- ^ Stein, William. Algebraic Number Theory, a Computational Approach (PDF). p. 29.
- ^ Bhatia 1997, p. 7
- ^ Garrett 2007, p. 381
Рекомендации
- Alagös, Y.; Oral, K.; Yüce, S. (2012). "Split Quaternion Matrices". Miskolc Mathematical Notes. 13 (2): 223–232. doi:10.18514/MMN.2012.364. ISSN 1787-2405 (open access)
- Atiyah, M. F.; MacDonald, I. G. (1969), Introduction to Commutative Algebra, Westview Press, ISBN 978-0-201-40751-8
- Barut, A. O.; Zeni, J. R.; Laufer, A. (1994a). "The exponential map for the conformal group O(2,4)". J. Phys. A: Math. Gen. 27 (15): 5239–5250. arXiv:hep-th/9408105. Bibcode:1994JPhA...27.5239B. doi:10.1088/0305-4470/27/15/022.
- Barut, A. O.; Zeni, J. R.; Laufer, A. (1994b). "The exponential map for the unitary group SU(2,2)". J. Phys. A: Math. Gen. 27 (20): 6799–6806. arXiv:hep-th/9408145. Bibcode:1994JPhA...27.6799B. doi:10.1088/0305-4470/27/20/017. S2CID 16495633.
- Bhatia, R. (1997). Matrix Analysis. Graduate texts in mathematics. 169. Springer. ISBN 978-0387948461.
- Brown, Lowell S. (1994). Quantum Field Theory. Cambridge University Press. ISBN 978-0-521-46946-3.
- Cayley, A. (1858). "A Memoir on the Theory of Matrices". Philos. Trans. 148.
- Cayley, A. (1889). The Collected Mathematical Papers of Arthur Cayley. (Classic Reprint). 2. Forgotten books. ASIN B008HUED9O.
- Crilly, T. (1998). "The young Arthur Cayley". Notes Rec. R. Soc. Lond. 52 (2): 267–282. doi:10.1098/rsnr.1998.0050. S2CID 146669911.
- Curtright, T L; Fairlie, D B; Zachos, C K (2014). "A compact formula for rotations as spin matrix polynomials". SIGMA. 10 (2014): 084. arXiv:1402.3541. Bibcode:2014SIGMA..10..084C. doi:10.3842/SIGMA.2014.084. S2CID 18776942.
- Frobenius, G. (1878). "Ueber lineare Substutionen und bilineare Formen". J. Reine Angew. Math. 1878 (84): 1–63. doi:10.1515/crll.1878.84.1.
- Gantmacher, F.R. (1960). The Theory of Matrices. NY: Chelsea Publishing. ISBN 978-0-8218-1376-8.
- Gatto, Letterio; Salehyan, Parham (2016), Hasse–Schmidt derivations on Grassmann algebras, Springer, doi:10.1007/978-3-319-31842-4, ISBN 978-3-319-31842-4, MR 3524604
- Gatto, Letterio; Scherbak, Inna (2015), Remarks on the Cayley-Hamilton Theorem, arXiv:1510.03022
- Garrett, Paul B. (2007). Abstract Algebra. NY: Chapman and Hall/CRC. ISBN 978-1584886891.
- Hamilton, W. R. (1853). Lectures on Quaternions. Dublin.
- Hamilton, W. R. (1864a). "On a New and General Method of Inverting a Linear and Quaternion Function of a Quaternion". Proceedings of the Royal Irish Academy. viii: 182–183. (communicated on June 9, 1862)
- Hamilton, W. R. (1864b). "On the Existence of a Symbolic and Biquadratic Equation, which is satisfied by the Symbol of Linear Operation in Quaternions". Proceedings of the Royal Irish Academy. viii: 190–101. (communicated on June 23, 1862)
- Hou, S. H. (1998). "Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm". SIAM Review. 40 (3): 706–709. Bibcode:1998SIAMR..40..706H. doi:10.1137/S003614459732076X. "Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm"
- Hamilton, W. R. (1862). "On the Existence of a Symbolic and Biquadratic Equation which is satisfied by the Symbol of Linear or Distributive Operation on a Quaternion". The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science. series iv. 24: 127–128. ISSN 1478-6435. Retrieved 2015-02-14.
- Householder, Alston S. (2006). The Theory of Matrices in Numerical Analysis. Dover Books on Mathematics. ISBN 978-0486449722.
- Laufer, A. (1997). "The exponential map of GL(N)". J. Phys. A: Math. Gen. 30 (15): 5455–5470. arXiv:hep-th/9604049. Bibcode:1997JPhA...30.5455L. doi:10.1088/0305-4470/30/15/029. S2CID 10699434.
- Tian, Y. (2000). "Matrix representations of octonions and their application". Advances in Applied Clifford Algebras. 10 (1): 61–90. arXiv:math/0003166. CiteSeerX 10.1.1.237.2217. doi:10.1007/BF03042010. ISSN 0188-7009. S2CID 14465054.
- Zeni, J. R.; Rodrigues, W.A. (1992). "A thoughtful study of Lorentz transformations by Clifford algebras". Int. J. Mod. Phys. A. 7 (8): 1793 pp. Bibcode:1992IJMPA...7.1793Z. doi:10.1142/S0217751X92000776.
- Zhang, F. (1997). "Quaternions and matrices of quaternions". Linear Algebra and Its Applications. 251: 21–57. doi:10.1016/0024-3795(95)00543-9. ISSN 0024-3795 (open archive).
Внешние ссылки
- "Cayley–Hamilton theorem", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
- A proof from PlanetMath.
- The Cayley–Hamilton theorem at MathPages