Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В исчислении , то цепное правило является формулой для вычисления производной из композиционной функции . То есть, если е и г являются дифференцируемыми функциями , то правило цепи , выражает производные их композиционный е г - функция , которая отображает й , чтобы - в терминах производных е и г и произведение функций следующим образом :

В качестве альтернативы, полагая h = f g (эквив., H ( x ) = f ( g ( x )) для всех x ), можно также записать цепное правило в обозначениях Лагранжа следующим образом:

Цепное правило можно также переписать в обозначениях Лейбница следующим образом. Если переменная z зависит от переменной y , которая сама зависит от переменной x (т. Е. Y и z являются зависимыми переменными ), то z через промежуточную переменную y также зависит от x . В этом случае цепное правило гласит, что:

Более точно, для указания точки каждая производная вычисляется по, .

Варианты цепного правила в обозначениях Лагранжа и Лейбница эквивалентны в том смысле, что если и , так что , то

и

[1]

Интуитивно цепное правило утверждает, что знание мгновенной скорости изменения z относительно y и скорости y относительно x позволяет вычислить мгновенную скорость изменения z относительно x . По словам Джорджа Ф. Симмонса : «если автомобиль едет в два раза быстрее велосипеда, а велосипед в четыре раза быстрее идущего человека, то автомобиль движется в 2 × 4 = 8 раз быстрее, чем человек». [2]

При интеграции аналогом цепного правила является правило замещения .

История [ править ]

Цепное правило, по-видимому, впервые использовал Готфрид Вильгельм Лейбниц . Он использовал его для вычисления производной от функции квадратного корня и функции . Он впервые упомянул об этом в мемуарах 1676 года (со знаковой ошибкой в ​​расчетах). Обычное обозначение цепного правила принадлежит Лейбницу. [3] Гийом де л'Опиталь неявно использовал цепное правило в своем « Анализе бесконечных петит» . Цепное правило не встречается ни в одной из аналитических книг Леонарда Эйлера , хотя они были написаны более чем через сто лет после открытия Лейбница.

Заявление [ править ]

Простейшая форма цепного правила предназначена для действительных функций одной действительной переменной. В нем говорится, что если g - функция, дифференцируемая в точке c (т. Е. Существует производная g ′ ( c ) ), а f - функция, дифференцируемая в точке g ( c ) , то составная функция f  ∘  g дифференцируема в точке c , а производная равна [4]

Правило иногда сокращается как

Если y = f ( u ) и u = g ( x ) , то эта сокращенная форма записывается в обозначениях Лейбница как:

[1]

Точки, в которых оцениваются производные, также могут быть указаны явно:

Продолжая те же рассуждения, учитывая n функций с составной функцией , если каждая функция дифференцируема на ее непосредственном входе, то составная функция также дифференцируема путем повторного применения цепного правила, где производная (в обозначениях Лейбница):

[5]

Приложения [ править ]

Отсутствие формул [ править ]

Может оказаться возможным применить цепное правило, даже если нет формул для дифференцируемых функций. Это может произойти, когда производные измеряются напрямую. Предположим, что машина едет на высокую гору. Спидометр автомобиля измеряет скорость напрямую. Если уклон известен, то скорость подъема можно рассчитать с помощью тригонометрии . Предположим, что автомобиль поднимается на2,5 км / ч . Стандартные модели атмосферы Земли предполагают, что температура падает примерно6,5 ° C на километр подъема (так называемый градиент ). Чтобы найти падение температуры за час, мы можем применить цепное правило. Пусть функция g ( t ) будет высотой автомобиля в момент времени t , а функция f ( h ) будет температурой на h километров над уровнем моря. f и g точно не известны: например, неизвестна высота, на которой машина начинает движение, и неизвестна температура на горе. Однако их производные известны: f есть−6,5 ° C / км , а g -2,5 км / ч . Цепное правило гласит, что производная сложной функции является произведением производной от f и производной от g . Это−6,5 ° C / км2,5 км / ч =-16,25 ° С / ч .

Одна из причин, по которой это вычисление возможно, состоит в том, что f ' является постоянной функцией. Для более точного описания того, как температура возле автомобиля меняется во времени, потребуется точная модель того, как температура изменяется на разных высотах. Эта модель может не иметь постоянной производной. Чтобы вычислить изменение температуры в такой модели, необходимо знать g, а не только g ' , потому что без знания g невозможно знать, где оценивать f ' .

Композиты из более чем двух функций [ править ]

Цепное правило может применяться к композитам, выполняющим более двух функций. Чтобы взять производную от композиции более чем двух функций, обратите внимание, что композиция f , g и h (в указанном порядке) является композицией f с gh . Цепное правило гласит , что для вычисления производной хгч , что достаточно , чтобы вычислить производную F и производный гч . Производная от f может быть вычислена напрямую, а производная от gh можно рассчитать, снова применив цепное правило.

Для конкретности рассмотрим функцию

Его можно разложить на три функции:

Их производные:

Цепное правило гласит, что производная их композиции в точке x = a равна:

В обозначениях Лейбница это:

или для краткости,

Следовательно, производная функция:

Другой способ вычисления этой производной - рассматривать составную функцию fgh как композицию fg и h . Применение цепного правила таким образом даст:

Это то же самое, что было вычислено выше. Этого следовало ожидать, потому что ( fg ) ∘ h = f ∘ ( gh ) .

Иногда бывает необходимо выделить произвольно длинный состав формы . В этом случае определите

где и когда . Тогда цепное правило принимает вид

или, в обозначениях Лагранжа,

Правило частного [ править ]

Цепное правило можно использовать для вывода некоторых хорошо известных правил дифференциации. Например, правило частного является следствием правила цепочки и правила продукта . Чтобы убедиться в этом, запишите функцию f ( x ) / g ( x ) как произведение f ( x ) · 1 / g ( x ) . Сначала примените правило продукта:

Чтобы вычислить производную от 1 / g ( x ) , обратите внимание, что она является составной частью g с обратной функцией, то есть функцией, которая отправляет x в 1 / x . Производная обратной функции равна . Применяя цепное правило, последнее выражение становится:

которая является обычной формулой для правила частного.

Производные обратных функций [ править ]

Предположим, что y = g ( x ) имеет обратную функцию . Вызовите его обратную функцию f, чтобы получилось x = f ( y ) . Существует формула для производной от f через производную от g . Чтобы убедиться в этом, заметьте, что f и g удовлетворяют формуле

А поскольку функции и x равны, их производные должны быть равны. Производная от x является постоянной функцией со значением 1, а производная от x определяется цепным правилом. Следовательно, мы имеем:

Для того, чтобы выразить как функция независимой переменной у , подставим для х , где она появляется. Тогда мы можем найти f ' .

Например, рассмотрим функцию g ( x ) = e x . Он имеет обратный f ( y ) = ln y . Поскольку g ′ ( x ) = e x , приведенная выше формула говорит, что

Эта формула верна всякий раз, когда g дифференцируема, и ее обратный f также дифференцируем. Эта формула может дать сбой, если одно из этих условий не выполняется. Например, рассмотрим g ( x ) = x 3 . Обратное к нему f ( y ) = y 1/3 , не дифференцируемое в нуле. Если мы попытаемся использовать приведенную выше формулу для вычисления производной f в нуле, то мы должны вычислить 1 / g '( f (0)) . Поскольку f (0) = 0 и g ′ (0) = 0, мы должны оценить 1/0, которая не определена. Следовательно, в этом случае формула не работает. Это неудивительно, потому что f не дифференцируема в нуле.

Высшие производные [ править ]

Формула Фаа ди Бруно обобщает цепное правило на высшие производные. Если предположить, что y = f ( u ) и u = g ( x ) , то первые несколько производных равны:

Доказательства [ править ]

Первое доказательство [ править ]

Одно из доказательств цепного правила начинается с определения производной:

Предположим пока, что не равно ни для какого x около a . Тогда предыдущее выражение равно произведению двух множителей:

Если качается рядом , то может случиться так, что независимо от того , насколько близко один получает , всегда есть еще ближе х такой , что равные . Например, это происходит для g ( x ) = x 2 sin (1 / x ) около точки a = 0 . Когда бы это ни случилось, приведенное выше выражение не определено, потому что оно включает деление на ноль . Чтобы обойти это, введите следующую функцию :

Мы покажем, что коэффициент разности для fg всегда равен:

Когда g ( x ) не равно g ( a ) , это ясно, потому что множители g ( x ) - g ( a ) сокращаются. Когда g ( x ) равно g ( a ) , то коэффициент разности для fg равен нулю, потому что f ( g ( x )) равно f ( g ( a )), а указанное выше произведение равно нулю, потому что оно равно f ′ ( g ( a )), умноженному на ноль. Таким образом, указанный выше продукт всегда равен коэффициенту разности, и чтобы показать, что производная от fg в точке a существует, и определить ее значение, нам нужно только показать, что предел, когда x переходит к a указанного выше продукта, существует, и определить его ценность.

Для этого напомним, что предел продукта существует, если существуют пределы его факторов. Когда это происходит, предел произведения этих двух факторов будет равен произведению пределов факторов. Два фактора - это Q ( g ( x )) и ( g ( x ) - g ( a )) / ( x - a ) . Последнее является разностным фактором для g в точке a , и поскольку g дифференцируема в точке a по предположению, ее предел, когда x стремится к a, существует и равенg ′ ( а ) .

Что касается Q ( g ( x )) , обратите внимание, что Q определено везде, где есть f . Кроме того, f дифференцируема в g ( a ) по предположению, поэтому Q непрерывна в g ( a ) по определению производной. Функция g непрерывна в точке a, поскольку она дифференцируема в точке a , а значит, Qg непрерывна в точке a . Таким образом , ее предел при х идет к асуществует и равно Q ( g ( a )) , то есть f ′ ( g ( a )) .

Это показывает, что пределы обоих множителей существуют и равны f ′ ( g ( a )) и g ′ ( a ) соответственно. Следовательно, производная fg в точке a существует и равна f ′ ( g ( a )) g ′ ( a ) . [5]

Второе доказательство [ править ]

Другой способ доказательства цепного правила - измерить ошибку линейного приближения, определяемую производной. Это доказательство имеет то преимущество, что оно обобщается на несколько переменных. Он основан на следующем эквивалентном определении дифференцируемости в точке: функция g дифференцируема в точке a, если существует действительное число g ′ ( a ), и функция ε ( h ), которая стремится к нулю, когда h стремится к нулю, и, кроме того,

Здесь левая часть представляет собой истинную разницу между значением g при a и при a + h , тогда как правая часть представляет приближение, определяемое производной плюс член ошибки.

В ситуации цепного правила такая функция ε существует, поскольку предполагается, что g дифференцируема в точке a . Опять же, по предположению, аналогичная функция также существует для f в g ( a ). Называя эту функцию η , имеем

Приведенное выше определение не налагает ограничений на η (0), хотя предполагается, что η ( k ) стремится к нулю, когда k стремится к нулю. Если положить η (0) = 0 , то η непрерывна в 0.

Доказательство теоремы требует изучения разности f ( g ( a + h )) - f ( g ( a )) при стремлении h к нулю. Первый шаг - заменить g ( a + h ), используя определение дифференцируемости g в точке a :

Следующим шагом будет использование определения дифференцируемости f в точке g ( a ). Для этого требуется член вида f ( g ( a ) + k ) для некоторого k . В приведенном выше уравнении правильный k изменяется в зависимости от h . Положим k h = g ′ ( a ) h + ε ( h ) h, и правая часть станет f ( g ( a ) + k h ) -f ( g ( a )) . Применение определения производной дает:

Чтобы изучить поведение этого выражения при стремлении h к нулю, разверните k h . После перегруппировки терминов правая часть станет:

Поскольку ε ( h ) и η ( k h ) стремятся к нулю, когда h стремится к нулю, первые два члена в квадратных скобках стремятся к нулю, когда h стремится к нулю. Применяя ту же теорему о произведениях пределов, что и в первом доказательстве, третий член в квадратных скобках также стремится к нулю. Поскольку приведенное выше выражение равно разности f ( g ( a + h )) - f ( g ( a )) , по определению производной fg дифференцируема в точке a, а ее производная равнаf ′ ( g ( a )) g ′ ( a ).

Роль Q в первом доказательстве играет η в этом доказательстве. Они связаны уравнением:

Необходимость определения Q в g ( a ) аналогична необходимости определения η в нуле.

Третье доказательство [ править ]

Альтернативное определение дифференцируемости функции Константина Каратеодори можно использовать для элегантного доказательства цепного правила. [6]

Согласно этому определению функция f дифференцируема в точке a тогда и только тогда, когда существует функция q , непрерывная в точке a и такая, что f ( x ) - f ( a ) = q ( x ) ( x - a ) . Таких функций не более одной, и если f дифференцируема в a, то f ′ ( a ) = q ( a ) .

Учитывая условия цепного правила и тот факт, что дифференцируемые функции и композиции непрерывных функций непрерывны, мы имеем, что существуют функции q , непрерывные в g ( a ) и r , непрерывные в a и такие, что

и

Следовательно,

но функция, задаваемая формулой h ( x ) = q ( g ( x )) r ( x ) , непрерывна в a , и для этого мы получаем a

Аналогичный подход работает для непрерывно дифференцируемых (векторных) функций многих переменных. Этот метод также позволяет факторинг единого подхода к более сильным формам дифференцируемости, когда производная требуется , чтобы быть липшицевы , гельдеровы и т.д. само по себе можно рассматривать как Дифференцирование теоремы полиномиального остатка (маленький Безу теоремы, или теорему фактора) , обобщенные на соответствующий класс функций. [ необходима цитата ]

Доказательство через бесконечно малые [ править ]

Если и затем выбирая бесконечно малое, мы вычисляем соответствующий, а затем соответствующий , так что

и применяя стандартную часть, получаем

что является цепным правилом.

Многопараметрический случай [ править ]

Обобщение цепного правила на функции с несколькими переменными носит довольно технический характер. Однако проще написать в случае функций вида

Поскольку этот случай часто встречается при изучении функций одной переменной, стоит описать его отдельно.

Случай f ( g 1 ( x ), ..., g k ( x )) [ править ]

Для написания цепного правила для функции вида

f ( g 1 ( x ), ..., g k ( x )) ,

нужны частные производные от f по k аргументам. Обычные обозначения для частных производных включают имена аргументов функции. Поскольку эти аргументы не упоминаются в приведенной выше формуле, проще и яснее обозначить через

производной от f по i- му аргументу, и на

значение этой производной в точке z .

В этих обозначениях цепное правило

Пример: арифметические операции [ править ]

Если функция f является сложением, то есть если

потом и . Таким образом, цепное правило дает

Для умножения

частичными являются и Таким образом,

Случай возведения в степень

немного сложнее, так как

и, как

Следует, что

Общее правило [ править ]

Самый простой способ записать цепное правило в общем случае - использовать полную производную , которая представляет собой линейное преобразование, которое захватывает все производные по направлениям в одной формуле. Рассмотрим дифференцируемые функции f  : R mR k и g  : R nR m , а также точку a в R n . Пусть D a g обозначает полную производную g в точке a, а D g ( a ) fобозначим полную производную f в точке g ( a ) . Эти две производные представляют собой линейные преобразования R nR m и R mR k соответственно, поэтому их можно составить. Цепное правило для полных производных состоит в том, что их состав - это полная производная от fg в точке a :

или для краткости,

Правило многомерной цепи можно доказать, используя технику, аналогичную второму доказательству, приведенному выше. [7]

Поскольку полная производная представляет собой линейное преобразование, функции, фигурирующие в формуле, можно переписать в виде матриц. Матрица, соответствующая полной производной, называется матрицей Якоби , а композиция двух производных соответствует произведению их матриц Якоби. Следовательно, с этой точки зрения цепное правило гласит:

или для краткости,

То есть якобиан составной функции - это произведение якобианов составных функций (вычисленных в соответствующих точках).

Правило одномерной цепи является обобщением правила одномерной цепи. Если k , m и n равны 1, так что f  : RR и g  : RR , то матрицы Якоби для f и g равны 1 × 1 . В частности, это:

Якобиан fg является произведением этих матриц 1 × 1 , поэтому он равен f ′ ( g ( a )) ⋅ g ′ ( a ) , как и ожидалось из правила одномерной цепи. На языке линейных преобразований D a ( g ) - это функция, которая масштабирует вектор с коэффициентом g ′ ( a ), а D g ( a ) ( f ) - это функция, масштабирующая вектор с коэффициентом f ′ ( г ( а)). Цепное правило гласит, что композиция этих двух линейных преобразований является линейным преобразованием D a ( fg ) , и, следовательно, это функция, которая масштабирует вектор на f ′ ( g ( a )) ⋅ g ′ ( a ).

Другой способ записать цепное правило используется, когда f и g выражаются через их компоненты как y = f ( u ) = ( f 1 ( u ),…, f k ( u )) и u = g ( x ) = ( g 1 ( x ),…, g m ( x )) . В этом случае приведенное выше правило для якобиевых матриц обычно записывается как:

Цепное правило для полных производных подразумевает цепное правило для частных производных. Напомним, что когда существует полная производная, частная производная в i- м координатном направлении находится путем умножения матрицы Якоби на i- й базисный вектор. Выполняя это по приведенной выше формуле, мы находим:

Поскольку элементы матрицы Якоби являются частными производными, мы можем упростить приведенную выше формулу, чтобы получить:

Более концептуально это правило выражает тот факт, что изменение направления x i может изменить все от g 1 до g m , и любое из этих изменений может повлиять на f .

В частном случае, когда k = 1 , так что f является действительной функцией, эта формула еще больше упрощается:

Это можно переписать как скалярное произведение . Напомним, что u = ( g 1 ,…, g m ) , частная производная u / ∂ x i также является вектором, а цепное правило гласит, что:

Пример [ править ]

Для u ( x , y ) = x 2 + 2 y, где x ( r , t ) = r sin ( t ) и y ( r , t ) = sin 2 ( t ) , определите значение u / ∂ r и u / ∂ t с использованием цепного правила.

и

Высшие производные функций многих переменных [ править ]

Формула Фа ди Бруно для производных высшего порядка от функций одной переменной обобщается на случай многих переменных. Если y = f ( u ) является функцией u = g ( x ), как указано выше, то вторая производная fg равна:

Дальнейшие обобщения [ править ]

Все расширения исчисления имеют цепное правило. В большинстве из них формула остается той же, хотя значение этой формулы может сильно отличаться.

Одно из обобщений - на многообразия . В этой ситуации цепное правило представляет собой тот факт, что производная от fg является смесью производной от f и производной от g . Эта теорема является непосредственным следствием правила цепи высших измерений, приведенного выше, и имеет точно такую ​​же формулу.

Цепное правило справедливо и для производных Фреше в банаховых пространствах . Формула та же, что и раньше. [8] Этот и предыдущий случай допускают одновременное обобщение на банаховы многообразия .

В дифференциальной алгебре производная интерпретируется как морфизм модулей кэлеровых дифференциалов . Кольцевой гомоморфизм из коммутативных колец F  : RS определяет морфизм Кэлера дифференциалы Df  : Ом R → Ом S , который посылает элемент дг к д ( е ( г )), внешний дифференциал F ( г ). Формула D ( fg ) = DfDg справедливо и в этом контексте.

Общей чертой этих примеров является то, что они выражают идею о том, что производная является частью функтора . Функтор - это операция над пространствами и функциями между ними. Он связывает с каждым пространством новое пространство, а с каждой функцией между двумя пространствами - новую функцию между соответствующими новыми пространствами. В каждом из перечисленных выше случаев функтор отправляет каждое пространство в его касательное расслоение, а каждую функцию - в свою производную. Например, в случае многообразия производная переводит C r -многообразие в C r −1 -многообразие (его касательное расслоение) и C r-функция к своей полной производной. Существует одно требование для того, чтобы это был функтор, а именно, что производная композиции должна быть смесью производных. Это в точности формула D ( fg ) = DfDg .

В стохастическом исчислении также есть цепные правила . Одна из них, лемма Ито , выражает композицию процесса Itō (или, в более общем смысле, семимартингала ) dX t с дважды дифференцируемой функцией f . В лемме Ито производная сложной функции зависит не только от dX t и производной функции f, но также и от второй производной функции f . Зависимость от второй производной является следствием ненулевой квадратичной вариациистохастического процесса, что в широком смысле означает, что процесс может двигаться вверх и вниз очень грубо. Этот вариант цепного правила не является примером функтора, потому что две составляемые функции имеют разные типы.

См. Также [ править ]

  • Интеграция заменой
  • Интегральное правило Лейбница
  • Правило частного
  • Правило тройного продукта
  • Правило продукта
  • Автоматическое дифференцирование - вычислительный метод, который интенсивно использует цепное правило для вычисления точных числовых производных.

Ссылки [ править ]

  1. ^ a b «Цепное правило в обозначениях Лейбница» . oregonstate.edu . Проверено 28 июля 2019 .
  2. ^ Джордж Ф. Симмонс , Исчисление с аналитической геометрией (1985), стр. 93.
  3. ^ Родригес, Омар Эрнандес; Лопес Фернандес, Хорхе М. (2010). «Семиотическое размышление о дидактике цепного правила» . Энтузиаст математики . 7 (2): 321–332 . Проверено 4 августа 2019 .
  4. ^ Апостол, Том (1974). Математический анализ (2-е изд.). Эддисон Уэсли. Теорема 5.5.
  5. ^ a b «Цепное правило для производной» . Математическое хранилище . 2016-06-05 . Проверено 28 июля 2019 .
  6. ^ Кун, Стивен (1991). «Производная á la Carathéodory». Американский математический ежемесячник . 98 (1): 40–44. JSTOR 2324035 . 
  7. ^ Спивак, Майкл (1965). Исчисление на многообразиях . Бостон: Эддисон-Уэсли. С. 19–20. ISBN 0-8053-9021-9.
  8. Перейти ↑ Cheney, Ward (2001). «Цепное правило и теоремы о среднем значении». Анализ для прикладной математики . Нью-Йорк: Спрингер. С. 121–125. ISBN 0-387-95279-9.

Внешние ссылки [ править ]

  • «Правило Лейбница» , Математическая энциклопедия , EMS Press , 2001 [1994]
  • Вайсштейн, Эрик В. «Цепное правило» . MathWorld .