В математике , матричное исчисление является специализированным для обозначения делать многомерные исчисления , особенно в пространствах матриц . Он собирает различные частные производные одной функции по многим переменным и / или многомерной функции по одной переменной в векторы и матрицы, которые можно рассматривать как отдельные объекты. Это значительно упрощает такие операции, как нахождение максимума или минимума функции многих переменных и решение систем дифференциальных уравнений . Обозначения, используемые здесь, обычно используются в статистике.и инженерное дело , тогда как в физике предпочтение отдается обозначению тензорного индекса .
Два конкурирующих соглашения об обозначениях разделяют область матричного исчисления на две отдельные группы. Эти две группы можно различить по тому, записывают ли они производную скаляра по вектору как вектор-столбец или вектор-строку . Оба эти соглашения возможны, даже если принято общее предположение, что векторы следует рассматривать как векторы-столбцы при объединении с матрицами (а не векторами-строками). Единое соглашение может быть несколько стандартным для одной области, которая обычно использует матричное исчисление (например, эконометрика , статистика, теория оценок и машинное обучение.). Однако даже в пределах одной области можно найти разных авторов, используя конкурирующие соглашения. Авторы обеих групп часто пишут так, как будто их конкретное соглашение было стандартным. При объединении результатов от разных авторов без тщательной проверки совместимости обозначений могут возникнуть серьезные ошибки. Определения этих двух соглашений и сравнения между ними собраны в разделе соглашений о компоновке .
Содержание
1 Область применения
1.1 Отношение к другим производным инструментам
1.2 Использование
2 Обозначения
2.1 Альтернативы
3 Производные с векторами
3.1 Вектор-за-скаляром
3.2 Скалярно-векторным
3.3 Вектор за вектором
4 Производные с матрицами
4.1 Матрица за скаляром
4.2 Скаляр по матрице
4.3 Другие производные матрицы
5 Соглашения о компоновке
5.1 Обозначение числителя-раскладки
5.2 Обозначение знаменателя-раскладки
6 идентичностей
6.1 Векторной идентичности
6.2 Скалярные векторные тождества
6.3 Векторно-скалярные тождества
6.4 Скалярно-матричные тождества
6.5 Матричные скалярные тождества
6.6 Скалярные тождества
6.6.1 С участием векторов
6.6.2 С задействованными матрицами
6.7 Тождества в дифференциальной форме
7 приложений
8 См. Также
9 Примечания
10 Ссылки
11 Дальнейшее чтение
12 Внешние ссылки
12.1 Информация
Сфера [ править ]
Матричное исчисление относится к ряду различных нотаций, в которых используются матрицы и векторы для сбора производной каждого компонента зависимой переменной по каждому компоненту независимой переменной. Как правило, независимая переменная может быть скаляром, вектором или матрицей, а зависимая переменная может быть любым из них. Каждая отдельная ситуация приведет к разному набору правил или отдельному исчислению , если использовать более широкий смысл этого термина. Матричная запись служит удобным способом систематизированного сбора множества производных.
В качестве первого примера рассмотрим градиент из векторного исчисления . Для скалярной функции трех независимых переменных, градиент задается векторным уравнением
,
где представляет собой единичный вектор в направлении для . Этот тип обобщенной производной можно рассматривать как производную от скаляра f по отношению к вектору , и ее результат можно легко собрать в векторной форме.
Более сложные примеры включают производную скалярной функции по матрице, известную как матрица градиента , которая собирает производную по каждому элементу матрицы в соответствующей позиции в результирующей матрице. В этом случае скаляр должен быть функцией каждой из независимых переменных в матрице. В качестве другого примера, если у нас есть n -вектор зависимых переменных или функций от m независимых переменных, мы могли бы рассматривать производную зависимого вектора по отношению к независимому вектору. Результат можно собрать в виде m × nматрица, состоящая из всех возможных производных комбинаций. Всего существует девять возможностей использования скаляров, векторов и матриц. Обратите внимание, что, рассматривая большее количество компонентов в каждой из независимых и зависимых переменных, мы можем остаться с очень большим количеством возможностей.
В следующей таблице собраны шесть видов производных, которые можно наиболее точно организовать в матричной форме. [1]
Типы производной матрицы
Типы
Скалярный
Вектор
Матрица
Скалярный
Вектор
Матрица
Здесь мы использовали термин «матрица» в самом общем смысле, признавая, что векторы и скаляры - это просто матрицы с одним столбцом и одной строкой соответственно. Кроме того, мы использовали жирные буквы для обозначения векторов и жирные заглавные буквы для матриц. Это обозначение используется повсюду.
Обратите внимание, что мы также можем говорить о производной вектора по матрице или любой другой незаполненной ячейке в нашей таблице. Однако эти производные наиболее естественно организованы в тензор с рангом выше 2, поэтому они не укладываются в матрицу. В следующих трех разделах мы определим каждую из этих производных и свяжем их с другими разделами математики. См. Более подробную таблицу в разделе условных обозначений компоновки .
Отношение к другим производным [ править ]
Матричная производная - это удобное обозначение для отслеживания частных производных для выполнения вычислений. Производная Фреше - это стандартный способ в функциональном анализе брать производные по векторам. В случае, если матрица-функция матрицы дифференцируема по Фреше, две производные будут согласованы с точностью до перевода обозначений. Как и в общем случае для частных производных , некоторые формулы могут быть расширены при более слабых аналитических условиях, чем существование производной как аппроксимирующего линейного отображения.
Использование [ править ]
Матричное исчисление используется для получения оптимальных стохастических оценок, часто с использованием множителей Лагранжа . Это включает в себя вывод:
Фильтр Калмана
Винеровский фильтр
Алгоритм ожидания-максимизации для гауссовой смеси
Градиентный спуск
Обозначение [ править ]
Производные векторов и матриц, представленные в следующих разделах, в полной мере используют матричную запись , используя одну переменную для представления большого числа переменных. Далее мы будем различать скаляры, векторы и матрицы по их начертанию. Обозначим через M ( n , m ) пространство вещественных матриц размера n × m с n строками и m столбцами. Такие матрицы будем обозначать жирными заглавными буквами: A , X , Y и т. Д. Элемент M ( n , 1), то есть вектор-столбец, обозначается полужирной строчной буквой: a , x , y и т.д. Элемент M (1,1) является скаляром, обозначается строчным курсивом: a , t , x и т. д. X T обозначает транспонирование матрицы , tr ( X ) - след , а det ( X ) или | X | это определитель . Предполагается, что все функции имеют класс дифференцируемости C 1если не указано иное. Обычно буквы из первой половины алфавита (a, b, c, ...) будут использоваться для обозначения констант, а из второй половины (t, x, y, ...) - для обозначения переменных.
ПРИМЕЧАНИЕ . Как упоминалось выше, существуют конкурирующие обозначения для представления систем частных производных в векторах и матрицах, и, похоже, пока нет стандарта. В следующих двух вводных разделах соглашение о компоновке числителя используется просто для удобства, чтобы не усложнять обсуждение. В разделе после них более подробно обсуждаются соглашения о компоновке . Важно понимать следующее:
Несмотря на использование терминов «расположение числителя» и «расположение знаменателя», на самом деле существует более двух возможных вариантов обозначений. Причина в том, что выбор числителя против знаменателя (или, в некоторых случаях, числителя против смешанного) может быть сделан независимо для скаляра за вектором, вектор за скаляром, вектор за вектором и скаляр за вектором. производные матрицы, и ряд авторов по-разному смешивают и согласовывают свой выбор макета.
Выбор схемы числителя во вводных разделах ниже не означает, что это «правильный» или «лучший» выбор. У различных типов макетов есть свои преимущества и недостатки. Неосторожное объединение формул, написанных на разных макетах, может привести к серьезным ошибкам, а преобразование одного макета в другой требует осторожности, чтобы избежать ошибок. В результате при работе с существующими формулами лучшей политикой, вероятно, является определение используемого макета и поддержание согласованности с ним, а не попытки использовать один и тот же макет во всех ситуациях.
Альтернативы [ править ]
Тензор индекс обозначения с Эйнштейна суммирования конвенции очень похож на матричном исчислении, за исключением того, один пишет только один компонент в то время. Его преимущество заключается в том, что можно легко манипулировать тензорами произвольно высокого ранга, тогда как тензоры ранга выше двух довольно громоздки с матричной записью. Вся работа здесь может быть выполнена в этих обозначениях без использования обозначений матрицы с одной переменной. Однако многие проблемы в теории оценивания и других областях прикладной математики могут привести к появлению слишком большого количества индексов, которые нельзя будет отслеживать должным образом, что указывает на пользу матричного исчисления в этих областях. Кроме того, обозначения Эйнштейна могут быть очень полезны при доказательстве представленных здесь тождеств (см. Раздел о дифференцировании) в качестве альтернативы типичной нотации элементов, которая может стать громоздкой при переносе явных сумм. Обратите внимание, что матрицу можно рассматривать как тензор второго ранга.
Производные с векторами [ править ]
Основная статья: Векторное исчисление
Поскольку векторы являются матрицами только с одним столбцом, простейшие производные матрицы - это производные вектора.
Обозначения разработаны здесь можно приспособить обычные операции векторного анализа путем определения пространства М ( п , 1) п -векторов с евклидовом пространства R п и скалярными М (1,1) идентифицируются с R . Соответствующее понятие из векторного исчисления указано в конце каждого подраздела.
ПРИМЕЧАНИЕ : Обсуждение в этом разделе предполагает использование схемы расположения числителя в педагогических целях. Некоторые авторы используют разные соглашения. В разделе о соглашениях о компоновке этот вопрос обсуждается более подробно. Идентификаторы, указанные ниже, представлены в формах, которые можно использовать в сочетании со всеми общепринятыми соглашениями о компоновке.
Vector-by-scalar [ править ]
Производный из вектора , с помощью скалярного х записываются (в числителе макет обозначений ) , как
В векторном исчислении производная вектора у относительно скалярного х известен как касательный вектор вектора у , . Обратите внимание, что y : R 1 → R m .
Пример Простые примеры этого включают в себя скорость вектор в евклидове пространства , которое является касательным вектором из положения вектора (как функции времени). Кроме того, ускорение - это касательный вектор скорости.
Скаляр по вектору [ править ]
Производный из скалярных у вектора , записываются (в числителе макет обозначений ) , как
В векторном исчислении , то градиент скалярного поля F в пространстве R п (чьи независимых координаты являются компонентами х ) является транспонированной производной скаляра вектора.
К примеру, в физике, электрическое поле является отрицательным вектором градиент от электрического потенциала .
Производная по направлению скалярной функции f ( x ) пространственного вектора x в направлении единичного вектора u (представленного в данном случае как вектор-столбец) определяется с использованием градиента следующим образом.
Используя обозначение, только что определенное для производной скаляра по вектору, мы можем переписать производную по направлению как. Этот тип записи будет удобен при доказательстве правил продукта и правил цепочки, которые выглядят похожими на то, с чем мы знакомы. для скалярной производной .
Vector-by-vector [ править ]
Каждый из двух предыдущих случаев можно рассматривать как применение производной вектора по отношению к вектору, используя соответственно вектор размера один. Аналогичным образом мы обнаружим, что производные, включающие матрицы, соответствующим образом сводятся к производным, содержащим векторы.
Производная векторной функции (вектора, компоненты которого являются функциями) по отношению к входному вектору записывается (в нотации расположения числителя ) как
В векторном исчислении производная векторной функции y по отношению к вектору x , компоненты которого представляют пространство, известна как прямая трансляция (или дифференциал) или матрица Якоби .
Прямое движение вдоль вектор-функции f по отношению к вектору v в R n определяется выражением
Производные с матрицами [ править ]
Есть два типа производных с матрицами, которые могут быть организованы в матрицу того же размера. Это производная матрицы по скаляру и производная от скаляра по матрице. Они могут быть полезны в задачах минимизации, встречающихся во многих областях прикладной математики, и получили названия касательная матрица и градиентная матрица соответственно после их аналогов для векторов.
Примечание . Обсуждение в этом разделе предполагает использование схемы расположения числителя в педагогических целях. Некоторые авторы используют разные соглашения. В разделе о соглашениях о компоновке этот вопрос обсуждается более подробно. Идентификаторы, указанные ниже, представлены в формах, которые можно использовать в сочетании со всеми общепринятыми соглашениями о компоновке.
Матрица за скаляром [ править ]
Производная матричной функции Y по скаляру x известна как касательная матрица и задается (в обозначении расположения числителя ) как
Скаляр по матрице [ править ]
Производная скалярной y- функции матрицы X независимых переменных размера p × q по отношению к матрице X задается (в обозначениях расположения числителя ) как
Важные примеры скалярных функций матриц включают след матрицы и определитель .
По аналогии с векторным исчислением эта производная часто записывается следующим образом.
Кроме того, в аналоговом с векторным исчислением , то производная по направлению скалярного F ( X ) из матрицы X в направлении матрицы Y задаются
Это матрица градиента, в частности, находит широкое применение в задачах минимизации в теории оценивания , в частности , в выводе из фильтра Калмана алгоритма, который имеет большое значение в этой области.
Другие производные матрицы [ править ]
Три типа производных, которые не рассматривались, - это производные, включающие векторы за матрицами, матрицы за векторами и матрицы за матрицами. Они не так широко рассматриваются, и их обозначения не получили широкого согласия.
Соглашения о макете [ править ]
В этом разделе обсуждаются сходства и различия между условными обозначениями, которые используются в различных областях, использующих преимущества матричного исчисления. Хотя в основном существует два согласованных соглашения, некоторые авторы считают удобным смешивать эти два соглашения в формах, обсуждаемых ниже. После этого раздела уравнения будут перечислены в обеих конкурирующих формах отдельно.
Фундаментальная проблема заключается в том, что производная вектора по вектору, т.е. часто записывается двумя конкурирующими способами. Если числитель y имеет размер m, а знаменатель x - размер n , то результат может быть представлен либо как матрица m × n, либо как матрица n × m , то есть элементы y, расположенные в столбцах, и элементы x выкладываются рядами или наоборот. Это приводит к следующим возможностям:
Расположение нумератора , т.е. расположение в соответствии с y и x T (т.е. в противоположность x ). Иногда это называют якобианской формулировкой . Это соответствует разметке m × n в предыдущем примере.
Расположение знаменателя , т.е. расположение в соответствии с y T и x (т.е. в противоположность y ). Иногда это называют гессенской формулировкой . Некоторые авторы называют этот макет градиентом в отличие от якобиана (макет числителя), который является его транспонированием. (Тем не менее, градиент чаще означает производную, независимо от макета.). Это соответствует разметке n × m в предыдущем примере.
Третья возможность, которую иногда видят, - это настаивать на записи производной как (т.е. производная берется относительно транспонирования x ) и следовать схеме числителя. Это позволяет утверждать, что матрица построена в соответствии с числителем и знаменателем. На практике это дает те же результаты, что и в числителе.
При работе с градиентом и в противоположном случае возникают те же проблемы. Чтобы быть последовательными, мы должны сделать одно из следующего:
Если мы выберем макет числителя, мы должны расположить градиент как вектор-строку и как вектор-столбец.
Если мы выберем макет знаменателя для, мы должны выложить градиент как вектор-столбец и как вектор-строку.
В третьей возможности выше, мы пишем и и раскладку использование числитель.
Не все учебники и статьи по математике единообразны в этом отношении. То есть иногда в одной книге или статье в разных контекстах используются разные условные обозначения. Например, некоторые выбирают макет знаменателя для градиентов (размещая их как векторы-столбцы), но макет числителя для производной вектор-вектор
Аналогичным образом , когда речь идет о скалярных по-матрице производных и матриц по-скалярных производных , то компоновка соответствует числителю лежит в соответствии с Y и X T , в то время как в соответствии макет знаменателя лежит в соответствии с Y T и X . На практике, однако, следование разметке знаменателя и размещение результата в соответствии с Y T редко встречается, поскольку это приводит к некрасивым формулам, которые не соответствуют скалярным формулам. В результате часто можно встретить следующие макеты:
Последовательная компоновка числителя , которая раскладывает в соответствии с Y , и в соответствии с X T .
Смешанная планировка , которая выкладывает в соответствии с Y и в соответствии с X .
Используйте обозначение результатов так же, как последовательное расположение числителя.
В следующих формулах мы обрабатываем пять возможных комбинаций и по отдельности. Мы также обрабатываем случаи скалярных производных, которые включают промежуточный вектор или матрицу. (Это может возникнуть, например, если многомерная параметрическая криваяопределяется в терминах скалярной переменной, а затем берется производная скалярной функции кривой по скаляру, который параметризует кривую.) Для каждой из различных комбинаций мы даем результаты размещения числителя и знаменателя , за исключением случаев, описанных выше, когда расположение знаменателя встречается редко. В случаях, связанных с матрицами, где это имеет смысл, мы приводим результаты в виде числителя и смешанного макета. Как отмечалось выше, случаи, когда знаменатели векторов и матриц записываются в транспонированной нотации, эквивалентны компоновке числителя, когда знаменатели записываются без транспонирования.
Имейте в виду, что разные авторы используют разные комбинации макетов числителя и знаменателя для разных типов производных, и нет никакой гарантии, что автор будет последовательно использовать макет числителя или знаменателя для всех типов. Сопоставьте приведенные ниже формулы с приведенными в источнике, чтобы определить макет, используемый для этого конкретного типа производного инструмента, но будьте осторожны, чтобы не предположить, что производные других типов обязательно следуют тому же виду макета.
При использовании производных со знаменателем агрегата (вектора или матрицы), чтобы найти максимум или минимум агрегата, следует иметь в виду, что использование макета числителя приведет к результатам, которые транспонируются относительно агрегата. Например, при попытке найти оценку максимального правдоподобия многомерного нормального распределения с использованием матричного исчисления, если домен представляет собой вектор-столбец k × 1, то результат с использованием макета числителя будет в форме вектора-строки 1 × k . Таким образом, следует либо транспонировать результаты в конце, либо использовать макет знаменателя (или смешанный макет).
Результат дифференциации различных агрегатов от других агрегатов.
Скаляр y
Вектор-столбец y (размер m × 1 )
Матрица Y (размер m × n )
Обозначение
Тип
Обозначение
Тип
Обозначение
Тип
Скаляр x
Числитель
Скалярный
Размер - вектор-столбец m
матрица m × n
Знаменатель
Размер- м вектор - строка
Вектор-столбец x (размер n × 1 )
Числитель
Размер - n вектор-строка
матрица m × n
Знаменатель
Размер - n вектор-столбец
матрица размера n × m
Матрица X (размер p × q )
Числитель
q × p матрица
Знаменатель
p × q матрица
Результаты операций будут транспонированы при переключении между нотацией числителя и расположения знаменателя.
Обозначение нумератора [ править ]
Используя нотацию числителя, мы имеем: [1]
Следующие определения даются только в нотации числителя:
Обозначение знаменателя-раскладки [ править ]
Используя обозначение «знаменатель», мы имеем: [2]
Личности [ править ]
Как отмечалось выше, в общем случае результаты операций будут транспонироваться при переключении между нотацией числителя-макета и нотации знаменателя-макета.
Чтобы помочь понять все ниже идентичностей, иметь в виду самые важные правила: правило цепи , правила продукта и правил сумм . Правило сумм применяется повсеместно, а правило произведения применяется в большинстве случаев, приведенных ниже, при условии сохранения порядка матричных произведений, поскольку матричные произведения не коммутативны. Правило цепочки применяется в некоторых случаях, но, к сожалению, не применяется к производным по матрице за скаляром или производным по скаляру по матрице (в последнем случае в основном используется оператор трассировки, применяемый к матрицам). В последнем случае правило продукта не может быть применено напрямую, но эквивалент можно сделать с немного большей работой, используя дифференциальные тождества.
Следующие идентификаторы принимают следующие соглашения:
скаляры a, b, c, d и e являются постоянными по отношению к, а скаляры u и v являются функциями одного из x, x или X ;
векторы a , b , c , d и e являются постоянными по отношению к, а векторы u и v являются функциями одного из x, x или X ;
матрицы, , В , С , D и Е являются постоянными в отношении, а матрицы, U и V являются функциями одного х, х , или X .
Отождествления в векторе за вектором [ править ]
Это представлено в первую очередь, потому что все операции, которые применяются к векторному дифференцированию, применяются непосредственно к векторному скалярному или скалярному векторному дифференцированию просто путем уменьшения соответствующего вектора в числителе или знаменателе до скаляра.
Идентичности: вектор за вектором
Условие
Выражение
Расположение числителя, т.е. по y и x T
Расположение знаменателя, т.е. по y T и x
a не является функцией x
A не является функцией x
A не является функцией x
a не является функцией x , u = u ( x )
v = v ( x ), u = u ( x )
A не является функцией x , u = u ( x )
и = и ( х ), v = v ( х )
и = и ( х )
и = и ( х )
Скалярные тождества по векторам [ править ]
Основные идентичности расположены над жирной черной линией.
Идентичности: скаляр за вектором
Условие
Выражение
Расположение числителя, т.е. по x T ; результат - вектор-строка
Расположение знаменателя, т.е. по x ; результат - вектор-столбец
a не является функцией x
[3]
[3]
a не является функцией x , u = u ( x )
и = и ( х ), v = v ( х )
и = и ( х ), v = v ( х )
и = и ( х )
и = и ( х )
и = и ( х ), v = v ( х )
в макете числителя
в макете знаменателя
u = u ( x ), v = v ( x ), A не является функцией x
в макете числителя
в макете знаменателя
, матрица Гессе [4]
a не является функцией x
A не является функцией x b не является функцией x
A не является функцией x
Не является функцией х есть симметрична
A не является функцией x
Не является функцией х есть симметрична
a не является функцией x , u = u ( x )
в макете числителя
в макете знаменателя
a , b не являются функциями x
A , b , C , D , e не являются функциями x
a не является функцией x
Векторно-скалярные тождества [ править ]
Идентичности: вектор за скаляром
Условие
Выражение
Расположение числителя, т.е. по y , результат - вектор-столбец
Расположение знаменателя, т.е. по y T , результат - вектор-строка
ПРИМЕЧАНИЕ . Формулы, включающие производные вектор за вектором и (выходными данными которых являются матрицы) предполагают, что матрицы расположены в соответствии с векторной компоновкой, т. Е. Матрица компоновки числителя, когда вектор компоновки числителя, и наоборот; в противном случае транспонируйте производные вектор за вектором.
Скалярно-матричные тождества [ править ]
Следует отметить , что точные эквиваленты скалярного правила продукта и цепочки правила не существует применительно к матричным функциям от матриц. Однако такое правило произведения действительно применяется к дифференциальной форме (см. Ниже), и это способ вывести многие из приведенных ниже тождеств, включающих функцию трассировки , в сочетании с тем фактом, что функция трассировки допускает транспонирование и циклическую перестановку, то есть:
Например, чтобы вычислить
Следовательно,
(Последний шаг см. В разделе Преобразование дифференциальной формы в производную .)
Тождества: скаляр по матрице
Условие
Выражение
Раскладка числителя, т.е. по X T
Расположение знаменателя, т.е. по X
a не является функцией X
[5]
[5]
a не является функцией X , u = u ( X )
и = и ( Х ), v = v ( Х )
и = и ( Х ), v = v ( Х )
и = и ( Х )
и = и ( Х )
U = U ( X )
[4]
Обе формы предполагают расположение числителя для
то есть смешанный макет если знаменатель макет для X используется.
a и b не являются функциями X
a и b не являются функциями X
a , b и C не являются функциями X
a , b и C не являются функциями X
U = U ( X ), V = V ( X )
a не является функцией X , U = U ( X )
g ( X ) - любой многочлен со скалярными коэффициентами или любая матричная функция, определенная бесконечным многочленом (например, e X , sin ( X ), cos ( X ), ln ( X ) и т. д. с использованием ряда Тейлора ); g ( x ) - эквивалентная скалярная функция, g ′ ( x ) - ее производная, а g ′ ( X ) - соответствующая матричная функция
A не является функцией X
[6]
A не является функцией X
[4]
A не является функцией X
[4]
A не является функцией X
[4]
A , B не являются функциями X
A , B , C не являются функциями X
n - положительное целое число
[4]
A не является функцией X , n - положительное целое число
[4]
[4]
[4]
[7]
a не является функцией X
[4] [8]
A , B не являются функциями X
[4]
n - положительное целое число
[4]
(см. псевдообратный )
[4]
(см. псевдообратный )
[4]
A не является функцией X , X квадратный и обратимый
A не является функцией X , X неквадратный, A симметричный
A не является функцией X , X неквадратный, A несимметричный
Матричные скалярные тождества [ править ]
Идентичности: матрица за скаляром
Условие
Выражение
Расположение числителя, т.е. по Y
U = U ( х )
A , B не являются функциями x , U = U ( x )
U = U ( х ), V = V ( х )
U = U ( х ), V = V ( х )
U = U ( х ), V = V ( х )
U = U ( х ), V = V ( х )
U = U ( х )
U = U ( х, у )
A не является функцией от x , g ( X ) - это любой многочлен со скалярными коэффициентами или любая матричная функция, определяемая бесконечным рядом многочленов (например, e X , sin ( X ), cos ( X ), ln ( X ) и т. .); g ( x ) - эквивалентная скалярная функция, g ′ ( x ) - ее производная, а g ′ ( X ) - соответствующая матричная функция
A не является функцией x
Далее см. Производная экспоненциального отображения .
Скалярные тождества [ править ]
С задействованными векторами [ править ]
Тождества: скаляр за скаляром, с вовлеченными векторами
Условие
Выражение
Любой макет (предполагается, что точечный продукт игнорирует макет строки и столбца)
и = и ( х )
и = и ( х ), v = v ( х )
С задействованными матрицами [ править ]
Тождества: скаляр за скаляром, с участием матриц [4]
Условие
Выражение
Последовательная компоновка числителя, т.е. по Y и X T
Смешанная раскладка, т.е. по Y и X
U = U ( х )
U = U ( х )
U = U ( х )
U = U ( х )
A не является функцией x , g ( X ) - это любой многочлен со скалярными коэффициентами или любая матричная функция, определяемая бесконечным рядом многочленов (например, e X , sin ( X ), cos ( X ), ln ( X ) и т. .); g ( x ) - эквивалентная скалярная функция, g ′ ( x ) - ее производная, а g ′ ( X ) - соответствующая матричная функция.
A не является функцией x
Личности в дифференциальной форме [ править ]
Часто проще работать в дифференциальной форме, а затем преобразовать обратно в обычные производные. Это хорошо работает только при использовании макета числителя. В этих правилах «а» - это скаляр.
Дифференциальные тождества: скаляр с матрицами [1] [4]
Условие
Выражение
Результат (расположение числителя)
Дифференциальные тождества: матрица [1] [4] [9]
Условие
Выражение
Результат (расположение числителя)
A не является функцией X
a не является функцией X
( Произведение Кронекера )
( Произведение Адамара )
( сопряженное транспонирование )
n - положительное целое число
является диагонализируемы
е является дифференцируемой на каждое собственное значение
В последней строке, является Кронекером , и это множество ортогональных проекторов , что проект на к -й собственному вектору X .Q является матрицей собственных векторов из , и собственных значений. Матрица - функция будет определена в терминах скалярной функции для диагонализуемых матриц , где с .
Чтобы преобразовать в нормальную производную форму, сначала преобразуйте ее в одну из следующих канонических форм, а затем используйте эти тождества:
Преобразование из дифференциальной формы в производную [1]
Каноническая дифференциальная форма
Эквивалентная производная форма
Приложения [ править ]
Матричное дифференциальное исчисление используется в статистике, особенно для статистического анализа многомерных распределений , особенно многомерного нормального распределения и других эллиптических распределений . [10] [11] [12]
Он используется в регрессионном анализе для вычисления, например, обычной формулы регрессии методом наименьших квадратов для случая нескольких независимых переменных .
См. Также [ править ]
Математический портал
Производная (обобщения)
Интеграл продукта
Исчисление Риччи
Примечания [ править ]
^ a b c d e Томас П., Минка (28 декабря 2000 г.). «Старая и новая матричная алгебра, полезная для статистики» . Примечание MIT Media Lab (1997; отредактировано 12/00) . Проверено 5 февраля +2016 .
^ Фелиппа, Карлос А. «Приложение D, линейная алгебра: детерминанты, обратные, ранг» (PDF) . ASEN 5007: Введение в методы конечных элементов . Боулдер, Колорадо: Университет Колорадо . Проверено 5 февраля +2016 .Использует гессианское ( транспонированное в якобианское ) определение векторных и матричных производных.
^ a b c Здесь относится к вектору-столбцу всех нулей размера n , где n - длина x .
^ a b c d e f g h i j k l m n o p q Петерсен, Кааре Брандт; Педерсен, Майкл Сискинд. Поваренная книга Матрицы (PDF) . Архивировано из оригинального 2 -го марта 2010 года . Проверено 5 февраля +2016 .Эта книга использует смешанную схему, т.е. Y в по X в
^ Б Здесь, относится к матрице все 0, одной и той же формы, что и X .
^ Дучи, Джон С. "Свойства следа и производных матрицы" (PDF) . Стэнфордский университет . Проверено 5 февраля +2016 .
^ См. Определитель # Производная для получения.
^ Константа a исчезает в результате. Это сделано намеренно. В целом,
или также
^ Джайлз, Майкл Б. (2008). «Расширенная коллекция результатов производной матрицы для алгоритмического дифференцирования в прямом и обратном режимах» (PDF) . S2CID 17431500 .Cite journal requires |journal= (help)
↑ Фанг и Чжан (1990)
↑ Pan & Fang (2007).
^ Колло & фон Розен (2005)
Ссылки [ править ]
Фанг, Кай-Тай ; Чжан, Яо-Тин (1990). Обобщенный многомерный анализ . Science Press (Пекин) и Springer-Verlag (Берлин). ISBN 3540176519. 9783540176510.
Колло, Тыну; фон Розен, Дитрих (2005). Расширенная многомерная статистика с матрицами . Дордрехт: Спрингер. ISBN 978-1-4020-3418-3.
Пан, Цзяньсинь; Фанг, Кайтай (2007). Модели кривой роста и статистическая диагностика . Пекин: Science Press. ISBN 9780387950532.
Дальнейшее чтение [ править ]
Лакс, Питер Д. (2007). «9. Исчисление векторных и матрично-значных функций». Линейная алгебра и ее приложения (2-е изд.). Хобокен, Нью-Джерси: Wiley-Interscience. ISBN 978-0-471-75156-4.
Магнус, Ян Р. (октябрь 2010 г.). «О понятии матричной производной». Журнал многомерного анализа . 101 (9): 2200–2206. DOI : 10.1016 / j.jmva.2010.05.005 .. Обратите внимание, что эта статья в Википедии была почти полностью переработана по сравнению с версией, критикуемой в этой статье.
Магнус, Ян Р. (1999). Матричное дифференциальное исчисление с приложениями в статистике и эконометрике . Neudecker, Хайнц. (Ред. Ред.). Нью-Йорк: Джон Вили. ISBN 0-471-98632-1. OCLC 40467399 .
Абадир, Карим М., 1964- (2005). Матричная алгебра . Магнус, Ян Р. Кембридж: Издательство Кембриджского университета. ISBN 978-0-511-64796-3. OCLC 569411497 .CS1 maint: multiple names: authors list (link)
Внешние ссылки [ править ]
Информация [ править ]
Справочное руководство по матрице , Майк Брукс, Имперский колледж Лондона .
Матричная дифференциация (и некоторые другие) , Рэндал Дж. Барнс, Департамент гражданского строительства, Университет Миннесоты.
Заметки о матричном исчислении , Пол Л. Факлер, Государственный университет Северной Каролины .
Матричное дифференциальное исчисление (слайд-презентация), Чжан Ле, Эдинбургский университет .
Введение в векторную и матричную дифференциацию (заметки о матричной дифференциации в контексте эконометрики ), Хейно Бон Нильсен.
Заметка о дифференцировании матриц (примечания о дифференцировании матриц), Павел Коваль, из Мюнхенского личного архива RePEc.
Векторное / матричное исчисление Дополнительные примечания о матричном дифференцировании.
Matrix Identities (заметки о матричном дифференцировании), Сэм Роуис.
vтеИсчисление
Precalculus
Биномиальная теорема
Вогнутая функция
Непрерывная функция
Факториал
Конечная разница
Свободные переменные и связанные переменные
График функции
Линейная функция
Радиан
Теорема Ролля
Секант
Склон
Касательная
Пределы
Неопределенная форма
Предел функции
Односторонний предел
Предел последовательности
Порядок приближения
(ε, δ) -определение предела
Дифференциальное исчисление
Производная
Дифференциальный
Дифференциальное уравнение
Дифференциальный оператор
Теорема о среднем значении
Обозначение
Обозначения Лейбница
Обозначение Ньютона
Правила дифференциации
линейность
Мощность
Сумма
Цепь
L'Hôpital's
Товар
Правило генерала Лейбница
Частное
Другие техники
Неявное дифференцирование
Обратные функции и дифференцирование
Логарифмическая производная
Связанные ставки
Стационарные точки
Тест первой производной
Тест второй производной
Теорема об экстремальном значении
Максимумы и минимумы
Дальнейшие приложения
Метод Ньютона
Теорема Тейлора
Интегральное исчисление
Первообразный
Длина дуги
Основные свойства
Константа интеграции
Основная теорема исчисления
Дифференцируя знаком интеграла
Интеграция по частям
Интеграция заменой
тригонометрический
Эйлер
Weierstrass
Частичные доли в интеграции
Квадратичный интеграл
Трапецеидальная линейка
Объемы
Метод мойки
Shell метод
Векторное исчисление
Производные
Завиток
Производная по направлению
Расхождение
Градиент
Лапласиан
Основные теоремы
Линейные интегралы
Зелень
Стокса
Гаусса
Многопараметрическое исчисление
Теорема расходимости
Геометрический
Матрица Гессе
Матрица Якоби и определитель
Множитель Лагранжа
Линейный интеграл
Матрица
Кратный интеграл
Частная производная
Поверхностный интеграл
Объемный интеграл
Дополнительные темы
Дифференциальные формы
Внешняя производная
Обобщенная теорема Стокса
Тензорное исчисление
Последовательности и серии
Арифметико-геометрическая последовательность
Типы серий
Чередование
Биномиальный
Фурье
Геометрический
Гармонический
Бесконечный
Мощность
Маклорен
Тейлор
Телескопирование
Тесты сходимости
Авеля
Чередование серий
Конденсация Коши
Прямое сравнение
Дирихле
интеграл
Сравнение пределов
Соотношение
Корень
Срок
Специальные функции и числа
Числа Бернулли
e (математическая константа)
Экспоненциальная функция
Натуральный логарифм
Приближение Стирлинга
История исчисления
Адекватность
Брук Тейлор
Колин Маклорен
Общность алгебры
Готфрид Вильгельм Лейбниц
Бесконечно малый
Исчисление бесконечно малых
Исаак Ньютон
Плавность
Закон непрерывности
Леонард Эйлер
Метод флюсий
Метод механических теорем
Списки
Правила дифференциации
Список интегралов от экспоненциальных функций
Список интегралов от гиперболических функций
Список интегралов обратных гиперболических функций
Список интегралов обратных тригонометрических функций