Это не официальный сайт wikipedia.org 01.01.2023

Функциональная производная — Википедия

Функциональная производная

В математике и теоретической физике функциональная производная является обобщением производной по направлению. Разница заключается в том, что для последней дифференцирование производится в направлении какого-нибудь вектора, а для первой речь идёт о функции. Оба эти понятия можно рассматривать как обобщение обычного дифференциального исчисления.

Существуют два основных вида функциональных производных, соответствующих общему определению производной Фреше и производной Гато функции на банаховом пространстве. На практике они зачастую не различаются.

ОпределениеПравить

Пусть F   — некоторый функционал, то есть функция, определённая на некотором множестве функций. Значение функционала F   на функции ϕ   обозначают F [ ϕ ]  . Его производная Гато (производная по направлению) есть предел (если он существует) выражения lim ε 0 F [ ϕ + ε δ ϕ ] F [ ϕ ] ε  . Здесь δ ϕ   — некоторая функция из области определения F  . Отметим, что такая производная, вообще говоря, зависит от выбора функции δ ϕ  . В этом смысле ситуация вполне аналогичная конечномерной. Например, функция y = | x |   дифференцируема в точке x = 0   справа и слева, но эти односторонние производные различны, а в обычном смысле эта функция в 0 не дифференцируема.

Гораздо чаще в приложениях возникает производная функционала, аналогичная классической конечномерной производной и являющаяся частным случаем производной Гато. Не давая общего определения, рассмотрим типичный пример: поиск экстремума функционала на множестве траекторий, проходящих через две заданные точки. Такая задача возникает при исследовании задач классической механики с помощью принципа наименьшего действия, подобного же типа задача о нахождении фигуры максимальной площади с заданным периметром и т. п.

Пусть функционал F   имеет интегральный вид[1]

F [ ϕ ] = a b L ( ϕ , ϕ ˙ , t ) d t  

Его первой вариацией называется выражение

δ F = F [ ϕ + δ ϕ ] F [ ϕ ]  

Если она представима в виде

δ F = a b S ( ϕ , ϕ ˙ , t ) δ ϕ ( t ) d t  

с точностью до величин второго порядка по δ ϕ  , то функция S   называется функциональной производной[2] F   по ϕ   и обозначается δ F δ ϕ  . Функционал при этом называют дифференцируемым.

Конкретно в данной задаче δ F δ ϕ = L ϕ d d t L ϕ ˙  , но в общем случае ответ существенно зависит от постановки задачи и граничных условий.

Вторая вариацияПравить

Если функционал дифференцируем, то можно определить аналог второй производной (в данном случае он скорее аналогичен матрице вторых частных производных). Раскладывая полную вариацию δ F   до второго порядка по δ φ   и отбрасывая величины первого порядка, получим выражение, называемое второй вариацией функционала:

δ 2 F = δ 2 F δ φ δ φ δ φ ( x ) δ φ ( x ) d x d x  

СвойстваПравить

Функциональная производная по свойствам аналогично обычной. Например:

  • Линейность. δ δ ϕ ( λ F + μ G ) = λ δ F δ ϕ + μ δ G δ ϕ ,   λ , μ C  
  • Тождество Лейбница. δ F G δ ϕ = δ F δ ϕ G + F δ G δ ϕ  
  • Разложение полной вариации по частным производным: δ F [ ϕ , ψ ] = δ F δ ϕ δ ϕ + δ F δ ψ δ ψ  
  • В точке экстремума функционала его производная равна 0. Точка экстремума является точкой минимума (максимума), если вторая вариация — положительно (отрицательно) определённая квадратичная форма.

и так далее.

ПримерыПравить

ЭнтропияПравить

Информационная энтропия дискретной случайной величины — это функционал функции вероятности.

H [ p ( x ) ] = x p ( x ) log p ( x )  

Поэтому

δ H δ p , ϕ = x δ H [ p ( x ) ] δ p ( x ) ϕ ( x ) = d d ϵ H [ p ( x ) + ϵ ϕ ( x ) ] | ϵ = 0 = d d ε x [ p ( x ) + ε ϕ ( x ) ] log [ p ( x ) + ε ϕ ( x ) ] | ε = 0 = x [ 1 + log p ( x ) ] ϕ ( x ) = [ 1 + log p ( x ) ] , ϕ .  

Поэтому

δ H δ p = [ 1 + log p ( x ) ] .  

ЭкспонентаПравить

Пусть

F [ φ ( x ) ] = e φ ( x ) g ( x ) d x .  

Используем в качестве пробной функции дельта-функцию:

δ F [ φ ( x ) ] δ φ ( y ) = lim ε 0 F [ φ ( x ) + ε δ ( x y ) ] F [ φ ( x ) ] ε = lim ε 0 e ( φ ( x ) + ε δ ( x y ) ) g ( x ) d x e φ ( x ) g ( x ) d x ε = e φ ( x ) g ( x ) d x lim ε 0 e ε δ ( x y ) g ( x ) d x 1 ε = e φ ( x ) g ( x ) d x lim ε 0 e ε g ( y ) 1 ε = e φ ( x ) g ( x ) d x g ( y ) .  

Поэтому

δ F [ φ ( x ) ] δ φ ( y ) = g ( y ) F [ φ ( x ) ] .  

ПримечанияПравить

  1. Леви, 1967, с. 42.
  2. Леви, 1967, с. 56-57.

ЛитератураПравить

  • Леви П. Конкретные проблемы функционального анализа. — М.: Наука, 1967. — 509 с.