Это не официальный сайт wikipedia.org 01.01.2023

Гессиан функции — Википедия

Гессиан функции

(перенаправлено с «Гессиан»)

Гессиан функции — симметрическая квадратичная форма[1], описывающая поведение функции во втором порядке.

Для функции f , дважды дифференцируемой в точке x R n

H ( x ) = i = 1 n j = 1 n a i j x i x j

или

H ( z ) = i = 1 n j = 1 n a i j z i z ¯ j

где a i j = 2 f / x i x j (или a i j = 2 f / z i z ¯ j ) и функция f задана на n -мерном вещественном пространстве R n (или комплексном пространстве C n ) с координатами x 1 , , x n (или z 1 , , z n ). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве, не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы ( a i j ) , см. ниже.

Матрица ГессеПравить

Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то

H ( f ) = [ 2 f x 1 2 2 f x 1 x 2 2 f x 1 x n 2 f x 2 x 1 2 f x 2 2 2 f x 2 x n 2 f x n x 1 2 f x n x 2 2 f x n 2 ]  

Определитель этой матрицы называется определителем Гессе, или просто гессианом[источник не указан 3741 день].

Матрицы Гессе используются в задачах оптимизации методом Ньютона. Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.

Симметрия матрицы ГессеПравить

Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали. Если они непрерывны, то порядок дифференцирования не важен:

x i ( f x j ) = x j ( f x i )  

Это можно также записать как

f x i x j = f x j x i , i , j { 1 , , n } .  

В этом случае матрица Гессе симметрична.

Критические точки функцииПравить

Если градиент f   (её векторная производная) равен нулю в некоторой точке x 0  , то эта точка называется критической. Достаточным условием существования экстремума в этой точке является знакоопределённость гессиана f (понимаемого в данном случае как квадратичная форма), а именно:

  • если гессиан положительно определён, то x 0   — точка локального минимума функции f ( x )  ,
  • если гессиан отрицательно определён, то x 0   — точка локального максимума функции f ( x )  ,
  • если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден ( det H ( f ) 0 )  , то x 0   — седловая точка функции f ( x )  .

Вариации и обобщенияПравить

Вектор-функцииПравить

Если f   — вектор-функция, то есть

f = ( f 1 , f 2 , , f n ) ,  

то её вторые частные производные образуют не матрицу, а тензор ранга 3, который можно рассматривать как массив из n   матриц Гессе:

H ( f ) = ( H ( f 1 ) , , H ( f n ) ) .  

При n = 1   данный тензор вырождается в обычную матрицу Гессе.

Окаймлённый гессианПравить

При решении задачи нахождения условного экстремума функции f : R n R   с ограничениями

{ g 1 ( x ) = 0 , g m ( x ) = 0 ,  

где x R n  , m < n  , для проверки достаточных условий экстремума можно использовать так называемый окаймлённый гессиан функции Лагранжа L ( x , λ )  , который будет иметь вид[2]

( 2 L x 2 2 L x λ ( 2 L x λ ) T 2 L λ 2 ) = ( 2 L x 1 2 2 L x 1 x n g 1 x 1 g m x 1 2 L x n x 1 2 L x n 2 g 1 x n g m x n g 1 x 1 g 1 x n 0 0 g m x 1 g m x n 0 0 ) .  

Проверка достаточных условий экстремума заключается в вычислении знаков детерминантов определённого набора подматриц окаймлённого гессиана. Именно, если существуют x R n   и λ R m   такие, что L ( x , λ ) = 0   и

( 1 ) m det ( 2 L x 1 2 2 L x 1 x p g 1 x 1 g m x 1 2 L x p x 1 2 L x p 2 g 1 x p g m x p g 1 x 1 g 1 x p 0 0 g m x 1 g m x p 0 0 ) > 0  

для p = m + 1 , , n  , то в точке x   функция f   имеет строгий условный минимум. Если же

( 1 ) p det ( 2 L x 1 2 2 L x 1 x p g 1 x 1 g m x 1 2 L x p x 1 2 L x p 2 g 1 x p g m x p g 1 x 1 g 1 x p 0 0 g m x 1 g m x p 0 0 ) > 0  

для p = m + 1 , , n  , то в точке x   функция f   имеет строгий условный максимум[3].

ИсторияПравить

Понятие введено Людвигом Отто Гессе (1844), который использовал другое название. Термин «гессиан» был введён Джеймсом Джозефом Сильвестром.

См. такжеПравить

ПримечанияПравить

  1. Гессиан  (неопр.). Дата обращения: 2 апреля 2016. Архивировано 15 апреля 2016 года.
  2. Hallam, Arne Econ 500: Quantitative Methods in Economic Analysis I  (неопр.). Iowa State (7 октября 2004). Дата обращения: 14 апреля 2021. Архивировано 19 апреля 2021 года.
  3. Neudecker, Heinz. Matrix Differential Calculus with Applications in Statistics and Econometrics / Heinz Neudecker, Jan R. Magnus. — New York : John Wiley & Sons, 1988. — P. 136. — ISBN 978-0-471-91516-4.

СсылкиПравить

  • Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
  • Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4. Или любое другое издание.
  • Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.