Это не официальный сайт wikipedia.org 01.01.2023

Распределение Дирихле — Википедия

Распределение Дирихле

В теории вероятностей и математической статистике распределение Дирихле (по имени Иоганна Петера Густава Лежён-Дирихлe), часто обозначаемое D i r ( α ) — это семейство непрерывных многомерных вероятностных распределений параметризованных вектором α неотрицательных вещественных чисел. Распределение Дирихле является обобщением Бета-распределения на многомерный случай. То есть, его функция плотности вероятности возвращает доверительную вероятность того, что вероятность каждого из K взаимоисключающих событий равна x i при условии, что каждое событие наблюдалось α i 1 раз.

Функция плотности вероятностиПравить

Функция плотности вероятности для распределения Дирихле порядка K есть[1]:

f ( x 1 , , x K ; α 1 , , α K ) = 1 B ( α ) i = 1 K x i α i 1  

где x i 0  , i = 1 K x i = 1  , α i > 0  , а B ( α ) = i = 1 K Γ ( α i ) Γ ( i = 1 K α i )   — многомерная бета-функция, где α = ( α 1 , , α K ) .  

СвойстваПравить

Пусть X = ( X 1 , , X K ) Dir ( α )   и α 0 = i = 1 K α i ,   тогда[1]

E [ X i α ] = α i α 0 ,  
V a r [ X i α ] = α i ( α 0 α i ) α 0 2 ( α 0 + 1 ) ,  
C o v [ X i X j α ] = α i α j α 0 2 ( α 0 + 1 ) .  

Модой распределения является вектор x = ( x 1 , . . . , x K )   с

x i = α i 1 α 0 K , α i > 1.  

Распределение Дирихле является сопряжённым априорным распределением к мультиномиальному распределению, а именно: если

β X = ( β 1 , , β K ) X Mult ( X ) ,  

где βi — число вхождений i в выборку из n точек дискретного распределения на {1, …, K} определенного через X, то

X β Dir ( α + β ) .  

Эта связь используется в Байесовской статистике для того, чтобы оценить скрытые параметры, X, дискретного вероятностного распределения, имея набор из n выборок. Очевидно, если априорное распределение обозначено как Dir(α), то Dir(α + β) есть апостериорное распределение после серии наблюдений с гистограммой β.

Связи с другими распределениямиПравить

Если для i { 1 , 2 , , K } ,  

Y i Gamma ( shape = α i , scale = 1 )   независимо, то
V = i = 1 K Y i Gamma ( shape = i = 1 K α i , scale = 1 ) ,  

и

( X 1 , , X K ) = ( Y 1 / V , , Y K / V ) Dir ( α 1 , , α K ) .  

Несмотря на то, что Xi не являются независимыми друг от друга, они могут быть сгенерированы из набора из K   независимых гамма случайных величин. К несчастью, так как сумма V   теряется в процессе формирования X = (X1, …, XK), становится невозможно восстановить начальные значения гамма случайных величин только по этим значениям. Тем не менее, благодаря тому, что работать с независимыми случайными величинами проще, это преобразование параметров может быть полезно при доказательстве свойств распределения Дирихле.

Генерация случайных чиселПравить

Метод построения случайного вектора x = ( x 1 , , x K )   для распределения Дирихле размерности K с параметрами ( α 1 , , α K )   следует непосредственно из этой связи. Сначала получим K независимых случайных выборок y 1 , , y K   из гамма-распределений, каждое из которых имеет плотность

y i α i 1 e y i Γ ( α i ) ,  

а затем положим

x i = y i / j = 1 K y j .  

Наглядная трактовка параметровПравить

В качестве примера использования распределения Дирихле можно предложить задачу, в которой требуется разрезать нитки (каждая начальной длины 1,0) на K частей с разными длинами так, чтобы все части имели заданную среднюю длину, но с возможностью некоторой вариации относительных длин частей. Значения α / α0 определяют средние длины частей нитки, получившиеся из распределения. Дисперсия вокруг среднего значения обратно пропорциональна α0.

См. такжеПравить

ПримечанияПравить

  1. 1 2 Гроот, 1974, с. 56—58.

ЛитератураПравить

  • М. де Гроотruen. Оптимальные статистические решения = Optimal Statistical Decisions. — М.: Мир, 1974. — 492 с.