Это не официальный сайт wikipedia.org 01.01.2023

Равенство смешанных производных — Википедия

Равенство смешанных производных

(перенаправлено с «Теорема Клеро о смешанных производных»)

Смешанные частные производные одной и той же функции, отличающиеся лишь порядком (очерёдностью) дифференцирования, равны между собой при условии их непрерывности. Такое свойство называется равенством смешанных производных.

Само утверждение о равенстве смешанных производных в различных источниках упоминается как теорема Шварца, теорема Клеро или теорема Янга.

ТеоремаПравить

Определение смешанной производнойПравить

Пусть дана достаточно гладкая (скалярная) функция f   многих переменных:

( 1 ) f = f ( x 1 , x 2 , x n )  

Мы можем взять частную производную этой функции по одному из аргументов x i  , считая остальные аргументы постоянными параметрами. В результате мы получим новую функцию:

( 2 ) ϕ ( x i ) = f x i | x 1 , x i 1 , x i + 1 , x n = c o n s t  

Эта новая функция тоже зависит от остальных аргументов как от параметров. То есть численное значение ϕ   в общем случае зависит от тех же переменных x 1 , x 2 , x n  , что и оригинальная функция f  :

( 3 ) ϕ = ϕ ( x 1 , x 2 , x n )  

Если функция ϕ   окажется достаточно гладкой, то мы можем и её продифференцировать, взяв частную производную по тому же самому или по другому аргументу x j  :

( 4 ) ϕ x j = 2 f x j x i  

Если j i  , то выражение в правой части равенства (4) называется смешанной производной.

Основа теоремыПравить

Для гладкой функции многих переменных значение смешанной производной не зависит от порядка дифференцирования:

( 5 ) 2 f x i x j = 2 f x j x i  

Теорема является базовой в теории функций многих переменных и широко применяется в математической физике, теории дифференциальных уравнений в частных производных, дифференциальной геометрии.

Необходимая степень гладкостиПравить

Уточнять необходимую степень гладкости следует поэтапно.

  • 1. Справедливость для аналитической функции (теорема).
  • 2. Справедливость для более широкого класса функций, имеющих в окрестности точки только такие непрерывные производные:
( 6 ) f x i , f x j , 2 f x i x j , 2 f x j x i  
  • 3. Поскольку для фиксированных индексов i , j   все производные из перечня (6) берутся при условии, что любой третий аргумент x k   является константой, то функция f   (а также все производные (6)) может быть разрывной в отношении третьих аргументов. Например, составим функцию из двух слагаемых:
f ( x 1 , x 2 , x n ) = Φ ( x i , x j ) + Z ( x i 1 , x i + 1 , x j 1 , x j + 1 , )  

где первое слагаемое является гладкой функцией двух аргументов, а второе слагаемое разрывной во всех точках.

Дальнейшее уточнение гладкости функции нужно делать в ходе доказательства теоремы, оно будет сформулировано в самом конце.

Доказательство теоремыПравить

Как указано выше, для доказательства теоремы можно не рассматривать зависимость функции от третьих аргументов. Поэтому для простоты записи изменим обозначения x i , x j   на x , y  , то есть будем рассматривать такую функцию двух переменных:

( 7 ) f = f ( x , y )  

Также для упрощения формул будем обозначать частные производные индексами внизу функции:

( 8 ) f x ( x , y ) = f ( x , y ) x , f y ( x , y ) = f ( x , y ) y  
( 8 a ) f x y = 2 f x y , f y x = 2 f y x  

Пусть в точке ( x , y )   существует смешанная производная:

( 9 ) f x y ( x , y ) = lim Δ x 0 f y ( x + Δ x , y ) f y ( x , y ) Δ x  

Предположим, что смешанная производная f x y   существует в точке ( x , y )  , а также существует первая производная f y ( x , y )   вдоль (горизонтальной) прямой y = c o n s t  .

Далее, разность производных равна производной от разности, поэтому превращаем формулу (9) в:

( 10 ) f x y ( x , y ) = lim Δ x 0 1 Δ x y [ f ( x + Δ x , y ) f ( x , y ) ]  

Это преобразование никаких дополнительных условий не накладывает, поскольку разность дифференцируемых функций всегда является функцией дифференцируемой.

Далее, разность в квадратных скобках формулы (10) можно записать в виде определённого интеграла от производной:

( 11 ) f x y ( x , y ) = lim Δ x 0 1 Δ x y x x + Δ x f x ( ξ , y ) d ξ  

Нужно, чтобы существовала частная производная f x   вдоль прямой y = c o n s t  .

Теперь частную производную по игрек в формуле (11) запишем согласно определению производной как предела:

( 12 ) f x y ( x , y ) = lim Δ x 0 1 Δ x lim Δ y 0 1 Δ y ( x x + Δ x f x ( ξ , y + Δ y ) d ξ x x + Δ x f x ( ξ , y ) d ξ )  

Как видно, надо, чтобы частная производная f x   существовала не только на прямой y = c o n s t  , но в некоторой двухмерной окрестности точки ( x , y )  .

Далее, разность интегралов равна интегралу от разности, причём под знак интеграла можно внести постоянный множитель 1 Δ y  :

( 13 ) f x y = lim Δ x 0 1 Δ x lim Δ y 0 x x + Δ x f x ( ξ , y + Δ y ) f x ( ξ , y ) Δ y d ξ  

Это преобразование также не накладывает дополнительных условий, поскольку разность интегрируемых функций является функцией интегрируемой.

По теореме Лагранжа, подынтегральное выражение в формуле (13) равно производной в средней точке:

( 14 ) f x ( ξ , y + Δ y ) f x ( ξ , y ) Δ y = f y x ( ξ , η )  

Средняя точка является функцией:

( 14 a ) η = η ( ξ , Δ y )  ,

значения которой лежат в интервале (если, например, Δ y > 0  )

( 14 b ) η [ y , y + Δ y ]  

Для справедливости (14) нужно существование смешанной производной f y x = 2 f y x   в некоторой двухмерной окрестности точки ( x , y )  .

Для окончания доказательства надо принять, что смешанная производная непрерывна в точке ( x , y )   как функция двух переменных. Значение этой производной в близкой точке ( ξ , η )   равно с точностью до бесконечно малого слагаемого значению производной в точке ( x , y )  :

( 15 ) f y x ( ξ , η ) = f y x ( x , y ) + o ( ξ x , η y )  

Смешанная производная f y x   существует в двухмерной окрестности точки ( x , y )   и непрерывна в этой точке как функция двух переменных.

Подставим (14) и (15) в (13):

( 16 ) f x y = lim Δ x 0 1 Δ x lim Δ y 0 x x + Δ x ( f y x ( x , y ) + o ( ξ x , η y ) ) d ξ  

Заметим, что формула (16) эквивалентна формуле (13) (хотя и в других обозначениях), а потому интеграл и обе границы существуют. Поскольку подынтегральная функция в (16) интегрируема, а первое слагаемое f y x ( x , y )   является константой по переменной интегрирования ξ  , то второе слагаемое тоже оказывается интегрируемым, и мы можем разбить интеграл на сумму двух интегралов, первый из которых легко берётся как интеграл от константы:

( 17 ) x x + Δ x ( f y x ( x , y ) + o ( ξ x , η y ) ) d ξ = x x + Δ x f y x ( x , y ) d ξ + x x + Δ x o ( ξ x , η y ) d ξ =  
= f y x Δ x + x x + Δ x o ( ξ x , η y ) d ξ  

После подстановки (17) в (16) мы можем вынести постоянное слагаемое сначала за пределы первой границы, а затем за пределы другой границы:

( 18 ) f x y = lim Δ x 0 1 Δ x ( f y x ( x , y ) Δ x + lim Δ y 0 x x + Δ x o ( ξ x , η ( ξ , Δ y ) y ) d ξ ) =  
= f y x ( x , y ) + lim Δ x 0 1 Δ x lim Δ y 0 x x + Δ x o ( ξ x , η ( ξ , Δ y ) y ) d ξ  

Покажем, что второе слагаемое в последнем выражении формулы (18) равно нулю. Возьмём произвольное положительное число ϵ  . Непрерывность смешанной производной f y x   в точке ( x , y )   означает, что существует такое положительное число δ  , что для каждой точки ( ξ , η )   внутри квадрата | ξ x | < δ , | η y | < δ   справедливо неравенство:

( 19 ) | o ( ξ x , η y ) | = | f y x ( ξ , η ) f y x ( x , y ) | < ϵ  

Если мы возьмём положительные числа Δ x < δ , Δ y < δ  , то интеграл в последнем слагаемом формулы (18) оценивается сверху:

( 20 ) x x + Δ x o ( ξ x , η ( ξ , Δ y ) y ) d ξ < x x + Δ x ϵ d ξ = ϵ Δ x  

Обозначим это слагаемое L  

( 21 ) L = lim Δ x 0 1 Δ x lim Δ y 0 x x + Δ x o ( ξ x , η ( ξ , Δ y ) y ) d ξ lim Δ x 0 1 Δ x lim Δ y 0 ϵ Δ x = ϵ  

Аналогично (если взять ϵ < Δ x < 0  ), имеем оценку снизу:

( 22 ) L ϵ  

Поскольку положительное число ϵ   может быть сколь угодно малым, то с необходимостью следует L = 0  . Теорема доказана.

Уточнение гладкости функцииПравить

Как видно в ходе доказательства, от функции требуется существование одной смешанной производной (например, f x y  ) в точке, а также существование второй смешанной производной f y x   в двумерной окрестности точки и её непрерывность в этой точке. Из этого условия также следует существование производной f y   вдоль отрезка прямой y = c o n s t   и существование производной f x   в двумерной окрестности точки.

Кроме того, существование f x y   в точке ( x , y )   следует из двух фактов: (а) существует производная f y   вдоль отрезка прямой y = c o n s t  , проходящей через точку ( x , y )  , (б) смешанная производная f y x   существует и непрерывна в этой точке.

ПримерПравить

Рассмотрим функцию

( 23 ) f ( x , y ) = x y + y 2 χ ( y )  

где функция Дирихле χ ( y )   равна нулю в рациональных точках y = m n   и единице в иррациональных. Функция (23) определена на всей плоскости; непрерывна (как функция двух переменных) вдоль прямой y = 0   и разрывна во всех других точках плоскости.

Везде существует непрерывная частная производная:

( 24 ) f x ( x , y ) = f x = y  

а также одна из смешанных производных:

( 25 ) f y x ( x , y ) = 2 f y x = 1  

Частная производная по игрек существует лишь в точках прямой y = 0  :

( 26 ) f y ( x , 0 ) = x  

Также в этих же точках прямой существует вторая смешанная производная:

( 27 ) f x y ( x , 0 ) = lim Δ x 0 f y ( x + Δ x , 0 ) f y ( x , 0 ) Δ x = 1  

Как видим, для точек прямой y = 0   условия теоремы выполняются, и обе смешанные производные равны.

КонтрпримерПравить

Рассмотрим функцию двух переменных x , y  

( 28 ) f ( x , y ) = | a x + b y | 3 x 2 + y 2  

где буквами a , b   обозначены некоторые ненулевые параметры. Формула (28) задаёт непрерывную функцию всюду на плоскости за исключением начала координат x = 0 , y = 0  . Мы можем доопределить функцию f ( x , y )   в начале координат

( 29 ) f ( 0 , 0 ) = 0  

Согласно этим определениям функция будет непрерывной также и в начале координат, что можно видеть, представив формулу (28) в полярной системе координат (и направляя r 0  ):

( 30 ) f ( r , ϕ ) = ( a 2 + b 2 ) 3 2 r 2 | sin ( ϕ + ϕ 0 ) | 3  

Покажем, что для этой доопределённой функции f ( x , y )   смешанные производные в начале координат существуют, но не равны между собой.

Сначала вычислим первые производные f x , f y  . Как промежуточный результат, заметим, что функция «куб модуля» дважды дифференцируема, и её первая и вторая производные вычисляются по формулам:

( 31 ) d d x | x | 3 = 3 x | x |  
( 31 a ) d 2 d x 2 | x | 3 = d d x ( 3 x | x | ) = 6 | x |  

Теперь, учитывая (28) и (31), запишем первые производные функции f ( x , y )   в точке плоскости, отличной от начала координат ( r = x 2 + y 2  ):

( 32 ) f x = 3 a ( a x + b y ) | a x + b y | r x r 3 | a x + b y | 3  
( 33 ) f y = 3 b ( a x + b y ) | a x + b y | r y r 3 | a x + b y | 3  

Можно также вычислить первые производные в начале координат, исходя из определения производной:

( 32 a ) f x ( 0 , 0 ) = lim x 0 f ( x , 0 ) f ( 0 , 0 ) x = lim x 0 | a x | 3 x | x | = 0  

Аналогично

( 33 a ) f y ( 0 , 0 ) = 0  

Перейдём теперь к вычислению смешанных производных в начале координат:

( 34 ) f x y ( 0 , 0 ) = lim x 0 f y ( x , 0 ) f y ( 0 , 0 ) x = lim x 0 1 x ( 3 b a x | a x | | x | ) = 3 a b | a |  

Аналогичное вычисление даёт:

( 35 ) f y x ( 0 , 0 ) = 3 a b | b |  

Легко видеть, что формулы (34) и (35) дают разные результаты, если:

( 36 ) | a | > 0 , | b | > 0 , | a | | b |  

Причина этого неравенства в том, что не выполняется условие теоремы — обе смешанные производные (хотя существуют везде) являются разрывными в начале координат.

Можно также рассмотреть функцию

f ( x , y ) = x y ( x 2 y 2 ) x 2 + y 2  

Упрощенное доказательство для аналитических функцийПравить

Аналитическая функция двух переменных (по крайней мере локально) разлагается в сходящийся степенной ряд:

( 37 ) f ( x , y ) = n , m = 0 a n m ( x x 0 ) n ( y y 0 ) m  

Как известно, степенной ряд можно дифференцировать почленно в пределах его радиуса сходимости. Таким образом, найдём первые производные:

( 38 ) f x = n , m = 0 n a n m ( x x 0 ) n 1 ( y y 0 ) m  
( 39 ) f y = n , m = 0 m a n m ( x x 0 ) n ( y y 0 ) m 1  

Повторное дифференцирование (38) и (39) даёт одну и ту же формулу для обеих смешанных производных:

( 40 ) f x y = f y x = n , m = 0 n m a n m ( x x 0 ) n 1 ( y y 0 ) m 1  

См. такжеПравить

ЛитератураПравить