Это не официальный сайт wikipedia.org 01.01.2023

Условия Вольфе — Википедия

Условия Вольфе — в теории оптимизации набор условий, которые используются в алгоритме приближенного поиска вдоль направления, в алгоритме Бройдена — Флетчера — Гольдфарба — Шанно (BFGS). Впервые опубликованы Филипом Вольфе в 1969 году.

ОписаниеПравить

Пусть решается задача минимизации

min x f ( x ) ,  

уже имеется приближение решения задачи x k   и пусть каким-либо методом мы нашли направление p k  , в котором будем искать новое приближение решения x k + 1  . Тогда x k + 1 = x k + α k p k  , где α k   удовлетворяет условиям Вольфе:

f ( x k + α k p k ) f ( x k ) + c 1 α k f k T p k ,  
f ( x k + α k p k ) T p k c 2 f k T p k  

Константы выбираются следующим образом: 0 < c 1 < c 2 < 1  . Обычно константа c 1   выбирается достаточно маленькой (в окрестности 0), что означает, что функция после совершения шага должна уменьшиться, в то время как c 2   выбирается значительно большей (в окрестности 1), что, в свою очередь, означает, что проекция градиента в новом приближении должна либо изменить направление, либо уменьшиться.

Усиленные условия ВольфеПравить

Другой вариант условий Вольфе, который предполагает, что новое приближение лежит в окрестности локального минимума функции ϕ ( α ) = f ( x k + α p k )  :

f ( x k + α k p k ) f ( x k ) + c 1 α k f k T p k ,  
| f ( x k + α k p k ) T p k | c 2 | f k T p k |  

Первое неравенство оставлено таким же, как и в условиях Вольфе, а второе изменено таким образом, чтобы проекция градиента должна уменьшиться по модулю. Таким образом исключаются точки, которые находятся далеко от стационарных точек функции ϕ  . Константы подбираются так же, как и в условиях Вольфе.

СвойстваПравить

Можно показать, что если p k   — направление убывания ограниченной снизу и непрерывно дифференциируемой функции f  , каждый шаг α k   удовлетворяет условиям Вольфе, а градиент функции f   непрерывен по Липшицу:

x , x ~ N | | f ( x ) f ( x ~ ) | | L | | x x ~ | | ,  

то

k 0 cos 2 θ k | | f k | | 2 < ,  

где

cos θ k = f k T p k | | f k | | | | p k | |  .

Отсюда следует, что

cos 2 θ k | | f k | | 2 0   при k  , что означает, что алгоритм сходится.

ЛитератураПравить

  1. Nocedal J., Wright S. Numerical optimization, series in operations research and financial engineering //Springer, New York. – 2006.
  2. Wolfe P. Convergence conditions for ascent methods //Siam Review. – 1969. – Т. 11. – №. 2. – С. 226-235.
  3. Wolfe P. Convergence conditions for ascent methods. II: Some corrections //SIAM review. – 1971. – Т. 13. – №. 2. – С. 185-188.