Это не официальный сайт wikipedia.org 01.01.2023

f-дивергенция — Википедия

f-дивергенцией (f-расхождением) называется класс функционалов D f ( P Q ) , определяющих в общем случае несимметричную меру расхождения между двумя распределениями вероятностей P и Q . Обычно применяется в теории информации и теории вероятностей. Функционал однозначно определяется (порождается) функцией f ( t ) , удовлетворяющей определённым условиям.

Данный класс дивергенций был введён и изучался независимо друг от друга учёными Csiszár (1963), Morimoto (1963) и Ali & Silvey (1966). Поэтому иногда можно встретить названия f-дивергенция Чисара, дивергенция Чисара—Моримото или расстояние Али—Силви.

ОпределениеПравить

Пусть P   и Q   — распределения вероятностей, заданные на множестве Ω  , такие что P   абсолютно непрерывно по отношению к Q  . Пусть функция f ( t )   выпукла при t 0   и f ( 1 ) = 0  . Тогда функция f   задаёт f-дивергенцию P   относительно Q   следующим образом:

D f ( P Q ) = Ω f ( d P d Q ) d Q = E Q f ( d P d Q ) .  

Если μ   — любая мера на Ω  , и оба распределения P   и Q   непрерывны относительно μ  , т.е. существуют функции p = d P d μ   и q = d Q d μ  , тогда f-дивергенция может быть записана как

D f ( P Q ) = Ω f ( p q ) q d μ .  

В случае лебеговой меры μ = x   распределения имеют плотности p ( x )   и q ( x )  , тогда f-дивергенция принимает вид

D f ( P Q ) = Ω f ( p ( x ) q ( x ) ) q ( x ) d x .  

Для дискретных распределений P = { p i }   и Q = { q i }  , где i = 1 , . . . , N  ,

D f ( P Q ) = i = 1 N f ( p i q i ) q i .  

Нужно заметить, что функция f ( t )   определена с точностью до слагаемого c ( t 1 )  , где c   — произвольная константа. Действительно, вид f-дивергенции не зависит от выбора c  , поскольку слагаемое c ( t 1 )   функции f ( t )   даёт нулевой вклад в значение интеграла. Кроме того, функция f ( t )   может содержать положительную мультипликативную константу k  , которая определяет единицу измерения дивергенции. В связи с этим некоторые авторы (например, Basseville (2010)) указывают дополнительные ограничения, налагаемые на функцию f ( t )  :

f ( 1 ) = 0 ,  
f ( 1 ) = 1.  

Первое из этих ограничений фиксирует константу c  , второе — константу k  . Условие f ( 1 ) = 0   может быть полезно тем, что в этом случае f ( t ) 0   с минимумом в точке t = 1   (см. Liese & Vajda (2006)), и выражение для f-дивергенции интуитивно проще воспринимается. Однако такой способ конкретизировать функцию f ( t )   не всегда удобен: например, для существования непрерывной версии f-энтропии, связанной с данной f-дивергенцией, может потребоваться другое значение константы c  .

f-дивергенция может быть разложена в ряд Тейлора и записана в виде взвешенной суммы расстояний χ-типа (см. Nielsen & Nock (2013)).

Частные случаи f-дивергенцииПравить

Многие известные дивергенции, такие как дивергенция Кульбака—Лейблера, квадрат расстояния Хеллингера, расстояние хи-квадрат и ряд других, являются частными случаями f-дивергенции, которым соответствует определённый выбор функции f ( t )  . В следующей таблице приведены некоторые распространённые виды дивергенций между распределениями вероятностей и соответствующая им функция f ( t )   (см. Liese & Vajda (2006)).

Дивергенция Порождающая функция f ( t )  
Дивергенция Кульбака—Лейблера t ln t  
Обратная Дивергенция Кульбака—Лейблера ln t  
Квадрат расстояния Хеллингера 1 2 ( t 1 ) 2 , 1 t , t t  
Расстояние полной вариации 1 2 | t 1 |  
Расстояние χ 2   Пирсона ( t 1 ) 2 , t 2 1 , t 2 t  
Расстояние χ 2   Неймана 1 t 1 , 1 t t  
Альфа-дивергенция { 4 1 α 2 ( t t ( 1 + α ) / 2 ) , если   α ± 1 , t ln t , если   α = 1 , ln t , если   α = 1  
Альфа-дивергенция (другие обозначения) { t α t α ( α 1 ) , если   α 0 , α 1 , t ln t , если   α = 1 , ln t , если   α = 0  

СвойстваПравить

  • Неотрицательность: ƒ-дивергенция всегда неотрицательна, и равна нулю, только если распределения P   и Q   совпадают. Это непосредственно следует из неравенства Йенсена:
    D f ( P Q ) = Ω f ( d P d Q ) d Q f ( Ω d P d Q d Q ) = f ( 1 ) = 0.  
  • Монотонность: если κ   — произвольная переходная вероятность, которая переводит меры P   и Q   соответственно в P κ   и Q κ  , тогда
    D f ( P Q ) D f ( P κ Q κ ) .  
    Равенство здесь имеет место тогда и только тогда, когда переход порождается достаточной статистикой по отношению к { P , Q }  .
  • Совместная выпуклость: для любого 0 λ 1  
    D f ( λ P 1 + ( 1 λ ) P 2 λ Q 1 + ( 1 λ ) Q 2 ) λ D f ( P 1 Q 1 ) + ( 1 λ ) D f ( P 2 Q 2 ) .  
    Это следует из выпуклости отображения ( p , q ) q f ( p / q )   на R + 2  .
  • Самодвойственность: если D ( P Q )   является f-дивергенцией, то D ( Q P )   тоже является f-дивергенцией, т.е. класс f-дивергенций содержит как прямые, так и обратные (двойственные) дивергенции. Действительно,
    D f ( P Q ) = d f D f ( Q P ) = Ω f ( d Q d P ) d P = Ω f ( d P d Q ) d Q = D f ( P Q ) ,  
    где f ( t ) = t f ( 1 / t )   — двойственная порождающая функция. Нетрудно видеть, что f ( 1 ) = f ( 1 ) = 0  , f ( t )   непрерывна (кроме, быть может, точки t = 0  ) и f ( t ) = 1 t 3 f ( 1 / t ) 0   почти всюду на t 0   в силу выпуклости f  , т.е. функция f ( t )   удовлетворяет условиям порождающей функции f-дивергенции.

С учётом последнего свойства класс f-дивергенций можно было бы эквивалентным образом определить как D f ( P Q ) = E P f ( d Q d P )  . Подобное определение встречается, например, у Zhang (2004). Таким образом, интерпретация распределения Q   как истинного, которая следует из определения f-дивергенции, не является её фундаментальным свойством, а является лишь следствием соглашения о порядке следования аргументов в определении. Иными словами, аргументы P   и Q   концептуально равноправны.

Также стоит отметить, что f-дивергенция является безразмерной величиной независимо от размерности множества Ω  .

Связанные понятияПравить

Кроме f-дивергенции, И. Чисар определил связанное с ней понятие f-энтропии (Csiszár (1972)).

СсылкиПравить