Гессиан функции
Гессиан функции — симметрическая квадратичная форма[1], описывающая поведение функции во втором порядке.
Для функции , дважды дифференцируемой в точке
или
где (или ) и функция задана на -мерном вещественном пространстве (или комплексном пространстве ) с координатами (или ). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве, не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы см. ниже.
Матрица ГессеПравить
Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то
Определитель этой матрицы называется определителем Гессе, или просто гессианом[источник не указан 3741 день].
Матрицы Гессе используются в задачах оптимизации методом Ньютона. Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.
Симметрия матрицы ГессеПравить
Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали. Если они непрерывны, то порядок дифференцирования не важен:
Это можно также записать как
В этом случае матрица Гессе симметрична.
Критические точки функцииПравить
Если градиент (её векторная производная) равен нулю в некоторой точке , то эта точка называется критической. Достаточным условием существования экстремума в этой точке является знакоопределённость гессиана f (понимаемого в данном случае как квадратичная форма), а именно:
- если гессиан положительно определён, то — точка локального минимума функции ,
- если гессиан отрицательно определён, то — точка локального максимума функции ,
- если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден , то — седловая точка функции .
Вариации и обобщенияПравить
Вектор-функцииПравить
Если — вектор-функция, то есть
то её вторые частные производные образуют не матрицу, а тензор ранга 3, который можно рассматривать как массив из матриц Гессе:
При данный тензор вырождается в обычную матрицу Гессе.
Окаймлённый гессианПравить
При решении задачи нахождения условного экстремума функции с ограничениями
где , , для проверки достаточных условий экстремума можно использовать так называемый окаймлённый гессиан функции Лагранжа , который будет иметь вид[2]
Проверка достаточных условий экстремума заключается в вычислении знаков детерминантов определённого набора подматриц окаймлённого гессиана. Именно, если существуют и такие, что и
для , то в точке функция имеет строгий условный минимум. Если же
для , то в точке функция имеет строгий условный максимум[3].
ИсторияПравить
Понятие введено Людвигом Отто Гессе (1844), который использовал другое название. Термин «гессиан» был введён Джеймсом Джозефом Сильвестром.
См. такжеПравить
- Якобиан
- Критическая точка (математика)
- Лемма Морса
- Критерий Сильвестра — критерий положительной или отрицательной определённости квадратной матрицы
ПримечанияПравить
- ↑ Гессиан (неопр.). Дата обращения: 2 апреля 2016. Архивировано 15 апреля 2016 года.
- ↑ Hallam, Arne Econ 500: Quantitative Methods in Economic Analysis I (неопр.). Iowa State (7 октября 2004). Дата обращения: 14 апреля 2021. Архивировано 19 апреля 2021 года.
- ↑ Neudecker, Heinz. Matrix Differential Calculus with Applications in Statistics and Econometrics / Heinz Neudecker, Jan R. Magnus. — New York : John Wiley & Sons, 1988. — P. 136. — ISBN 978-0-471-91516-4.
СсылкиПравить
- Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
- Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4. Или любое другое издание.
- Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.