Правило цепи - Chain rule - Wikipedia

В исчисление, то Правило цепи это формула вычислить производная из составной функция. То есть, если ж и грамм находятся дифференцируемые функции, то цепное правило выражает производную их составных ж грамм - функция, отображающая Икс к - в терминах производных от ж и грамм и продукт функций следующее:

В качестве альтернативы, позволяя час = ж грамм (эквивалент, час(Икс) = ж(грамм(Икс)) для всех Икс), можно также записать цепное правило в Обозначения Лагранжа, следующее:

Цепное правило также можно переписать на Обозначения Лейбница следующим образом. Если переменная z зависит от переменной у, который сам зависит от переменной Икс (т.е. у и z находятся зависимые переменные ), тогда z, через промежуточную переменную у, зависит от Икс также. В этом случае цепное правило гласит, что:

Точнее, чтобы указать точку, в которой оценивается каждая производная, .

Варианты цепного правила в обозначениях Лагранжа и Лейбница эквивалентны в том смысле, что если и , так что , тогда

и

[1]

Интуитивно цепное правило гласит, что знание мгновенной скорости изменения z относительно у и что из у относительно Икс позволяет рассчитать мгновенную скорость изменения z относительно Икс. По словам Джордж Ф. Симмонс: «если машина едет в два раза быстрее велосипеда, а велосипед в четыре раза быстрее идущего человека, то машина едет в 2 × 4 = 8 раз быстрее человека».[2]

В интеграция, аналогом цепного правила является правило замены.

История

Цепное правило, кажется, впервые было использовано Готфрид Вильгельм Лейбниц. Он использовал его для вычисления производной от как композиция функции квадратного корня и функции . Он впервые упомянул об этом в мемуарах 1676 года (со знаковой ошибкой в ​​расчетах). Обычное обозначение цепного правила принадлежит Лейбницу.[3] Гийом де л'Опиталь неявно использовал цепное правило в своем Анализируйте des infiniment petits. Цепное правило не встречается ни в одном из Леонард Эйлер книги по анализу, хотя они были написаны более чем через сто лет после открытия Лейбница.

Одно измерение

Первый пример

Предположим, что парашютист прыгает с самолета. Предположить, что т через секунды после прыжка его высота над уровнем моря в метрах определяется выражением грамм(т) = 4000 − 4.9т2. Одна модель для атмосферное давление на высоте час является ж(час) = 101325 е−0.0001час. Эти два уравнения можно дифференцировать и комбинировать различными способами для получения следующих данных:

  • грамм′(т) = −9.8т скорость парашютиста во время т.
  • ж′(час) = −10.1325е−0.0001час - скорость изменения атмосферного давления по высоте на высоте час и пропорционален подъемная сила на парашютистке в час метров над уровнем моря. (Истинная подъемная сила зависит от объема парашютиста.)
  • (жграмм)(т) атмосферное давление, которое испытывает парашютист т секунд после его прыжка.
  • (жграмм)′(т) - скорость изменения атмосферного давления во времени при т секунд после прыжка парашютиста и пропорциональна выталкивающей силе парашютиста на т секунд после его прыжка.

Здесь цепное правило дает метод вычисления (жграмм)′(т) с точки зрения ж и грамм. Хотя всегда можно напрямую применить определение производной для вычисления производной сложной функции, обычно это очень сложно. Полезность цепного правила состоит в том, что оно превращает сложную производную в несколько простых производных.

Цепное правило гласит, что при соответствующих условиях

В этом примере это равно

В формулировке цепного правила ж и грамм играть немного разные роли, потому что f ' оценивается в , в то время как грамм' оценивается в т. Это необходимо для правильной работы агрегатов.

Например, предположим, что мы хотим вычислить скорость изменения атмосферного давления через десять секунд после прыжка парашютиста. Это (жграмм)′(10) и имеет единицы паскали в секунду. Фактор грамм′(10) в цепном правиле - скорость парашютиста через десять секунд после его прыжка, выраженная в метрах в секунду. - изменение давления по высоте на высоте грамм(10) и выражается в паскалях на метр. Продукт и поэтому имеет правильные единицы паскалей в секунду.

Здесь обратите внимание, что невозможно оценить ж где-нибудь еще. Например, 10 в задаче представляет десять секунд, а выражение будет представлять изменение давления на высоте десяти метров, что не то, что мы хотели. Аналогично, пока грамм′(10) = −98 имеет единицы метры в секунду, выражение ж′(грамм′(10)) будет представлять изменение давления на высоте -98 метров, что опять же не то, что мы хотели. Тем не мение, грамм(10) находится на высоте 3020 метров над уровнем моря, высота парашютиста через десять секунд после его прыжка, и это имеет правильные единицы для ввода в ж.

Заявление

Простейшая форма цепного правила - для действительных функций одного настоящий Переменная. В нем говорится, что если грамм - функция, дифференцируемая в точке c (т.е. производная грамм′(c) существует) и ж - функция, дифференцируемая в грамм(c), то составная функция ж ∘ грамм дифференцируема в c, а производная равна[4]

Правило иногда сокращается как

Если у = ж(ты) и ты = грамм(Икс), то эта сокращенная форма записывается в Обозначение Лейбница в качестве:

[1]

Точки, в которых оцениваются производные, также могут быть указаны явно:

Продолжая те же рассуждения, учитывая п функции со сложной функцией , если каждая функция дифференцируема на ее непосредственном входе, то составная функция также дифференцируема путем повторного применения цепного правила, где производная (в обозначениях Лейбница):

[5]

Дальнейшие примеры

Отсутствие формул

Может оказаться возможным применить цепное правило, даже если нет формул для дифференцируемых функций. Это может произойти, когда производные измеряются напрямую. Предположим, что машина едет на высокую гору. Спидометр автомобиля измеряет скорость напрямую. Если оценка известно, то скорость подъема может быть рассчитана с использованием тригонометрия. Предположим, что автомобиль поднимается на 2,5 км / ч. Стандартные модели атмосферы Земли предполагают, что температура падает примерно 6.5 ° С за километр подъема (называемый скорость отклонения ). Чтобы найти падение температуры за час, мы можем применить цепное правило. Пусть функция грамм(т) быть высотой автомобиля во время т, и пусть функция ж(час) быть температурой час километров над уровнем моря. ж и грамм точно не известны: например, неизвестна высота, на которой машина начинает движение, и неизвестна температура на горе. Однако известны их производные: ж является −6,5 ° C / км, и грамм является 2,5 км / ч. Цепное правило гласит, что производная сложной функции является произведением производной от ж и производная от грамм. Это −6,5 ° C / км2,5 км / ч = −16,25 ° С / ч.

Одна из причин, почему это вычисление возможно, состоит в том, что ж - постоянная функция. Для более точного описания того, как температура возле автомобиля меняется во времени, потребуется точная модель того, как температура изменяется на разных высотах. Эта модель может не иметь постоянной производной. Чтобы вычислить изменение температуры в такой модели, необходимо знать грамм и не только грамм, потому что не зная грамм невозможно знать, где оценивать ж.

Композиты с более чем двумя функциями

Цепное правило может применяться к композитам, выполняющим более двух функций. Чтобы взять производную от композиции более чем двух функций, обратите внимание, что композиция ж, грамм, и час (в этом порядке) является составной частью ж с граммчас. Цепное правило гласит, что для вычисления производной от жграммчас, достаточно вычислить производную от ж и производная от граммчас. Производная от ж можно вычислить напрямую, а производная от граммчас можно рассчитать, снова применив цепное правило.

Для конкретности рассмотрим функцию

Его можно разложить на три функции:

Их производные:

Цепное правило гласит, что производная их композиции в точке Икс = а является:

В обозначениях Лейбница это:

или для краткости,

Следовательно, производная функция:

Другой способ вычисления этой производной - просмотреть составную функцию жграммчас как совокупность жграмм и час. Применение цепного правила таким образом даст:

Это то же самое, что было вычислено выше. Этого следовало ожидать, потому что (жграмм) ∘ час = ж ∘ (граммчас).

Иногда необходимо различать сколь угодно длинную композицию вида . В этом случае определите

куда и когда . Тогда цепное правило принимает вид

или, в обозначениях Лагранжа,

Правило частного

Цепное правило можно использовать для вывода некоторых хорошо известных правил дифференциации. Например, правило частного является следствием цепного правила и правила правило продукта. Чтобы в этом убедиться, напишите функцию ж(Икс)/грамм(Икс) как продукт ж(Икс) · 1/грамм(Икс). Сначала примените правило продукта:

Чтобы вычислить производную от 1/грамм(Икс), обратите внимание, что это составная часть грамм с обратной функцией, то есть функцией, которая отправляет Икс к 1/Икс. Производная обратной функции равна . Применяя цепное правило, последнее выражение становится:

которая является обычной формулой для правила частного.

Производные обратных функций

Предположим, что у = грамм(Икс) имеет обратная функция. Вызовите его обратную функцию ж так что у нас есть Икс = ж(у). Есть формула для производной от ж в терминах производной от грамм. Чтобы увидеть это, обратите внимание, что ж и грамм удовлетворяют формуле

И поскольку функции и Икс равны, их производные должны быть равны. Производная от Икс - постоянная функция со значением 1, а производная от определяется цепным правилом. Следовательно, мы имеем:

Выражать f ' как функция независимой переменной у, мы подставляем за Икс где бы он ни появлялся. Тогда мы можем решить для f '.

Например, рассмотрим функцию грамм(Икс) = еИкс. Имеет обратное ж(у) = ln у. Потому что грамм′(Икс) = еИкс, приведенная выше формула говорит, что

Эта формула верна всякий раз, когда грамм дифференцируема и обратная ей ж также дифференцируема. Эта формула может не работать, если одно из этих условий не выполняется. Например, рассмотрим грамм(Икс) = Икс3. Его обратное ж(у) = у1/3, которая не дифференцируема в нуле. Если мы попытаемся использовать приведенную выше формулу для вычисления производной от ж в нуле, то мы должны оценить 1/грамм′(ж(0)). С ж(0) = 0 и грамм′(0) = 0, мы должны оценить 1/0, что не определено. Следовательно, в этом случае формула не работает. Это не удивительно, потому что ж не дифференцируема в нуле.

Высшие производные

Формула Фаа ди Бруно обобщает цепное правило на более высокие производные. При условии, что у = ж(ты) и ты = грамм(Икс), то первые несколько производных:

Доказательства

Первое доказательство

Одно из доказательств цепного правила начинается с определения производной:

Предположим пока, что не равно для любого Икс возле а. Тогда предыдущее выражение равно произведению двух множителей:

Если колеблется около а, то может случиться так, что независимо от того, насколько близко вы подойдете к а, всегда есть еще ближе Икс такой, что равно . Например, это происходит для грамм(Икс) = Икс2грех (1 / Икс) рядом с точкой а = 0. Когда бы это ни происходило, приведенное выше выражение не определено, потому что оно включает деление на ноль. Чтобы обойти это, введите функцию следующее:

Мы покажем, что коэффициент разницы за жграмм всегда равно:

В любое время грамм(Икс) не равно грамм(а), это ясно, потому что факторы грамм(Икс) − грамм(а) Отмена. Когда грамм(Икс) равно грамм(а), то коэффициент разности для жграмм равен нулю, потому что ж(грамм(Икс)) равно ж(грамм(а)), а указанный выше продукт равен нулю, потому что он равен ж′(грамм(а)) умножить на ноль. Таким образом, указанный выше продукт всегда равен коэффициенту разности, и чтобы показать, что производная от жграмм в а существует, и чтобы определить его значение, нам нужно только показать, что предел как Икс идет в а вышеуказанного продукта существует и определить его стоимость.

Для этого напомним, что предел продукта существует, если существуют пределы его факторов. Когда это происходит, предел произведения этих двух факторов будет равен произведению пределов факторов. Два фактора: Q(грамм(Икс)) и (грамм(Икс) − грамм(а)) / (Икса). Последний является коэффициентом разницы для грамм в а, и потому что грамм дифференцируема в а по предположению, его предел при Икс как правило а существует и равно грамм′(а).

Что касается Q(грамм(Икс)), Заметь Q определяется везде ж является. Более того, ж дифференцируема в грамм(а) по предположению, поэтому Q непрерывно на грамм(а), по определению производной. Функция грамм непрерывно на а потому что он дифференцируем на а, и поэтому Qграмм непрерывно на а. Так что его предел как Икс идет в а существует и равно Q(грамм(а)), который ж′(грамм(а)).

Это показывает, что пределы обоих факторов существуют и равны ж′(грамм(а)) и грамм′(а), соответственно. Следовательно, производная от жграмм в а существует и равно ж′(грамм(а))грамм′(а).[5]

Второе доказательство

Другой способ доказательства цепного правила - измерить ошибку линейного приближения, определяемую производной. Это доказательство имеет то преимущество, что оно обобщается на несколько переменных. Он основан на следующем эквивалентном определении дифференцируемости в точке: функция грамм дифференцируема в а если существует действительное число грамм′(а) и функция ε(час), которая стремится к нулю при час стремится к нулю, а кроме того

Здесь левая часть представляет собой истинную разницу между значением грамм в а и в а + час, тогда как правая часть представляет собой приближение, определяемое производной плюс член ошибки.

В ситуации цепного правила такая функция ε существует потому что грамм предполагается дифференцируемым в а. Опять-таки по предположению аналогичная функция существует и для ж в грамм(а). Вызов этой функции η, у нас есть

Приведенное выше определение не накладывает ограничений на η(0), хотя предполагается, что η(k) стремится к нулю при k стремится к нулю. Если мы установим η(0) = 0, тогда η непрерывна в 0.

Доказательство теоремы требует изучения разности ж(грамм(а + час)) − ж(грамм(а)) в качестве час стремится к нулю. Первый шаг - заменить грамм(а + час) используя определение дифференцируемости грамм в а:

Следующим шагом будет использование определения дифференцируемости ж в грамм(а). Для этого требуется термин вида ж(грамм(а) + k) для некоторых k. В приведенном выше уравнении правильный k варьируется в зависимости от час. Набор kчас = грамм′(а) час + ε(час) час и правая сторона становится ж(грамм(а) + kчас) − ж(грамм(а)). Применение определения производной дает:

Чтобы изучить поведение этого выражения как час стремится к нулю, расширить kчас. После перегруппировки терминов правая часть станет:

Потому что ε(час) и η(kчас) стремятся к нулю при час стремится к нулю, первые два члена в квадратных скобках стремятся к нулю, поскольку час стремится к нулю. Применяя ту же теорему о произведениях пределов, что и в первом доказательстве, третий член в квадратных скобках также стремится к нулю. Поскольку приведенное выше выражение равно разнице ж(грамм(а + час)) − ж(грамм(а)), по определению производной жграмм дифференцируема в а и его производная ж′(грамм(а)) грамм′(а).

Роль Q в первом доказательстве играет η в этом доказательстве. Они связаны уравнением:

Необходимость определения Q в грамм(а) аналогично необходимости определить η на нуле.

Третье доказательство

Константин Каратеодори Альтернативное определение дифференцируемости функции может быть использовано для элегантного доказательства цепного правила.[6]

Согласно этому определению функция ж дифференцируема в точке а тогда и только тогда, когда есть функция q, непрерывно на а и такой, что ж(Икс) − ж(а) = q(Икс)(Икса). Существует не более одной такой функции, и если ж дифференцируема в а тогда ж ′(а) = q(а).

Учитывая предположения цепного правила и тот факт, что дифференцируемые функции и композиции непрерывных функций непрерывны, мы имеем, что существуют функции q, непрерывно на грамм(а) и р, непрерывно на а и такой, что,

и

Следовательно,

но функция, заданная час(Икс) = q(грамм(Икс))р(Икс) непрерывно на а, и мы получаем для этого а

Аналогичный подход работает для непрерывно дифференцируемых (векторных) функций многих переменных. Этот метод факторинга также позволяет использовать единый подход к более сильным формам дифференцируемости, когда требуется, чтобы производная была Липшицева непрерывная, Гёльдер непрерывный и т.д. Сама дифференциация может рассматриваться как теорема о полиномиальном остатке (немного Безу теорема, или факторная теорема), обобщенные на соответствующий класс функций.[нужна цитата ]

Доказательство через бесконечно малые

Если и затем выбирая бесконечно малую мы вычисляем соответствующие а затем соответствующий , так что

и применяя стандартная часть мы получаем

что является цепным правилом.

Многопараметрический случай

Обобщение цепного правила на функции с несколькими переменными скорее технический. Однако проще написать в случае функций вида

Поскольку этот случай часто встречается при изучении функций одной переменной, стоит описать его отдельно.

В случае если ж(грамм1(Икс), ... , граммk(Икс))

Для написания цепного правила для функции вида

ж(грамм1(Икс), ... , граммk(Икс)),

нужно частные производные из ж в отношении его k аргументы. Обычные обозначения частных производных включают имена аргументов функции. Поскольку эти аргументы не упоминаются в приведенной выше формуле, проще и яснее обозначить через

производная от ж в отношении его я-й аргумент, и

значение этой производной при z.

В этих обозначениях цепное правило

Пример: арифметические операции

Если функция ж является сложением, то есть если

тогда и . Таким образом, цепное правило дает

Для умножения

частичные и Таким образом,

Случай возведения в степень

немного сложнее, так как

и, как

Следует, что

Общее правило

Самый простой способ записать цепное правило в общем случае - использовать полная производная, которое представляет собой линейное преобразование, охватывающее все направленные производные в единой формуле. Рассмотрим дифференцируемые функции ж : рмрk и грамм : рпрм, и точка а в рп. Позволять Dа грамм обозначают полную производную от грамм в а и Dграмм(а) ж обозначают полную производную от ж в грамм(а). Эти две производные являются линейными преобразованиями рпрм и рмрkсоответственно, чтобы их можно было составить. Цепное правило для полных производных состоит в том, что их состав - это полная производная от жграмм в а:

или для краткости,

Правило многомерной цепи можно доказать, используя технику, аналогичную второму доказательству, приведенному выше.[7]

Поскольку полная производная представляет собой линейное преобразование, функции, фигурирующие в формуле, можно переписать в виде матриц. Матрица, соответствующая полной производной, называется Матрица якобиана, а композиция двух производных соответствует произведению их матриц Якоби. Следовательно, с этой точки зрения цепное правило гласит:

или для краткости,

То есть якобиан составной функции - это произведение якобианов составных функций (вычисленных в соответствующих точках).

Правило одномерной цепи является обобщением правила одномерной цепи. Если k, м, и п равны 1, так что ж : рр и грамм : рр, то матрицы Якоби ж и грамм находятся 1 × 1. В частности, это:

Якобиан жграмм продукт этих 1 × 1 матрицы, так что это ж′(грамм(а))⋅грамм′(а), как и следовало ожидать из правила одномерной цепи. На языке линейных преобразований Dа(грамм) - функция, которая масштабирует вектор с коэффициентом грамм′(а) и Dграмм(а)(ж) - функция, которая масштабирует вектор с коэффициентом ж′(грамм(а)). Цепное правило гласит, что комбинация этих двух линейных преобразований является линейным преобразованием Dа(жграмм), и, следовательно, это функция, которая масштабирует вектор на ж′(грамм(а))⋅грамм′(а).

Другой способ написания цепного правила используется, когда ж и грамм выражаются в терминах своих компонентов как у = ж(ты) = (ж1(ты), …, жk(ты)) и ты = грамм(Икс) = (грамм1(Икс), …, граммм(Икс)). В этом случае приведенное выше правило для якобиевых матриц обычно записывается как:

Цепное правило для полных производных подразумевает цепное правило для частных производных. Напомним, что когда существует полная производная, частная производная в я-го координатное направление находится путем умножения матрицы Якоби на я-й базисный вектор. Выполняя это по приведенной выше формуле, мы находим:

Поскольку элементы матрицы Якоби являются частными производными, мы можем упростить приведенную выше формулу, чтобы получить:

Более концептуально это правило выражает тот факт, что изменение Икся направление может изменить все грамм1 через граммм, и любое из этих изменений может повлиять на ж.

В частном случае, когда k = 1, так что ж является вещественной функцией, то эта формула еще более упрощается:

Это можно переписать как скалярное произведение. Напоминая, что ты = (грамм1, …, граммм), частная производная ты / ∂Икся также является вектором, а цепное правило гласит:

Пример

Данный ты(Икс, у) = Икс2 + 2у куда Икс(р, т) = р грех (т) и у(р,т) = грех2(т), определить значение ты / ∂р и ты / ∂т используя цепное правило.

и

Высшие производные функций многих переменных

Формула Фа ди Бруно для производных высшего порядка от функций одной переменной обобщается на случай многих переменных. Если у = ж(ты) является функцией ты = грамм(Икс) как и выше, то вторая производная от жграмм является:

Дальнейшие обобщения

Все расширения исчисления имеют цепное правило. В большинстве из них формула остается той же, хотя значение этой формулы может сильно отличаться.

Одно обобщение - коллекторы. В этой ситуации цепное правило представляет собой тот факт, что производная от жграмм является составной производной от ж и производная от грамм. Эта теорема является непосредственным следствием правила цепочки высших измерений, приведенного выше, и имеет точно такую ​​же формулу.

Цепное правило также действует для Производные Фреше в Банаховы пространства. Формула та же, что и раньше.[8] Этот и предыдущий случай допускают одновременное обобщение на Банаховы многообразия.

В дифференциальная алгебра, производная интерпретируется как морфизм модулей Дифференциалы Kähler. А кольцевой гомоморфизм из коммутативные кольца ж : рS определяет морфизм кэлеровых дифференциалов Df : Ωр → ΩS который отправляет элемент доктор к d(ж(р)) внешний дифференциал ж(р). Формула D(жграмм) = DfDg справедливо и в этом контексте.

Общей чертой этих примеров является то, что они выражают идею о том, что производная является частью функтор. Функтор - это операция над пространствами и функциями между ними. Он связывает с каждым пространством новое пространство, а с каждой функцией между двумя пространствами - новую функцию между соответствующими новыми пространствами. В каждом из приведенных выше случаев функтор отправляет каждое пространство в его касательный пучок и он отправляет каждую функцию ее производной. Например, в случае многообразия производная посылает Cр-многообразие к Cр−1-многообразие (его касательное расслоение) и Cр-функция к своей полной производной. Существует одно требование для того, чтобы это был функтор, а именно, что производная композиции должна быть смесью производных. Это в точности формула D(жграмм) = DfDg.

Также существуют цепные правила в стохастическое исчисление. Один из них, Лемма Ито, выражает состав процесса Itō (или, в более общем смысле, семимартингал ) dXт с дважды дифференцируемой функцией ж. В лемме Ито производная сложной функции зависит не только от dXт и производная от ж но и на второй производной от ж. Зависимость от второй производной является следствием ненулевой квадратичная вариация стохастического процесса, что в широком смысле означает, что процесс может двигаться вверх и вниз очень грубо. Этот вариант цепного правила не является примером функтора, потому что две составляемые функции имеют разные типы.

Смотрите также

Рекомендации

  1. ^ а б «Цепное правило в нотации Лейбница». oregonstate.edu. Получено 2019-07-28.
  2. ^ Джордж Ф. Симмонс, Исчисление с аналитической геометрией (1985), стр. 93.
  3. ^ Родригес, Омар Эрнандес; Лопес Фернандес, Хорхе М. (2010). «Семиотическое размышление о дидактике цепного правила». Энтузиаст математики. 7 (2): 321–332. Получено 2019-08-04.
  4. ^ Апостол, Том (1974). Математический анализ (2-е изд.). Эддисон Уэсли. Теорема 5.5.
  5. ^ а б «Цепное правило для производной». Математическое хранилище. 2016-06-05. Получено 2019-07-28.
  6. ^ Кун, Стивен (1991). «Производная á la Carathéodory». Американский математический ежемесячник. 98 (1): 40–44. JSTOR  2324035.
  7. ^ Спивак Михаил (1965). Исчисление на многообразиях. Бостон: Эддисон-Уэсли. С. 19–20. ISBN  0-8053-9021-9.
  8. ^ Чейни, Уорд (2001). «Цепное правило и теоремы о среднем значении». Анализ для прикладной математики. Нью-Йорк: Спрингер. С. 121–125. ISBN  0-387-95279-9.

внешняя ссылка