Распределение Дирихле

В теории вероятностей и математической статистике распределение Дирихле (по имени Иоганна Петера Густава Лежён-Дирихлe), часто обозначаемое $\text{[math]}$ $\text{[math]}$ $\mathrm {Dir} (\alpha )$ $\mathrm {Dir} (\alpha )$ — это семейство непрерывных многомерных вероятностных распределений параметризованных вектором α неотрицательных вещественных чисел. Распределение Дирихле является обобщением Бета-распределения на многомерный случай. То есть, его функция плотности вероятности возвращает доверительную вероятность того, что вероятность каждого из $\text{[math]}$ $\text{[math]}$ $K$ $K$ взаимоисключающих событий равна $\text{[math]}$ $\text{[math]}$ $x_{i}$ $x_{i}$ при условии, что каждое событие наблюдалось $\text{[math]}$ $\text{[math]}$ $\alpha _{i}-1$ $\alpha _{i}-1$ раз.

Функция плотности вероятностиПравить

Функция плотности вероятности для распределения Дирихле порядка K есть^[1]:

\text{[math]}

f(x_{1},\dots ,x_{K};\alpha _{1},\dots ,\alpha _{K})={\frac {1}{\mathrm {B} (\alpha )}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}

где $\text{[math]}$ $\text{[math]}$ $x_{i}\geq 0$ , $\text{[math]}$ $\text{[math]}$ $\sum _{i=1}^{K}x_{i}=1$ , $\text{[math]}$ $\text{[math]}$ $\alpha _{i}>0$ , а $\text{[math]}$ $\text{[math]}$ ${\mathrm {B} (\alpha )}={\frac {\prod \limits _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma \left(\sum \limits _{i=1}^{K}\alpha _{i}\right)}}$ — многомерная бета-функция, где $\text{[math]}$ $\text{[math]}$ $\alpha =(\alpha _{1},\ldots ,\alpha _{K}).$

СвойстваПравить

Пусть $\text{[math]}$ $\text{[math]}$ $X=(X_{1},\ldots ,X_{K})\sim \operatorname {Dir} (\alpha )$ и $\text{[math]}$ $\text{[math]}$ $\alpha _{0}=\sum _{i=1}^{K}\alpha _{i},$ тогда^[1]

\text{[math]}

\mathrm {E} [X_{i}\mid \alpha ]={\frac {\alpha _{i}}{\alpha _{0}}},

\text{[math]}

\mathrm {Var} [X_{i}\mid \alpha ]={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1)}},

\text{[math]}

\mathrm {Cov} [X_{i}X_{j}\mid \alpha ]={\frac {-\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}.

Модой распределения является вектор $\text{[math]}$ $\text{[math]}$ $x=(x_{1},...,x_{K})$ с

\text{[math]}

x_{i}={\frac {\alpha _{i}-1}{\alpha _{0}-K}},\quad \alpha _{i}>1.

Распределение Дирихле является сопряжённым априорным распределением к мультиномиальному распределению, а именно: если

\text{[math]}

\beta \mid X=(\beta _{1},\ldots ,\beta _{K})\mid X\sim \operatorname {Mult} (X),

где β_i — число вхождений i в выборку из n точек дискретного распределения на {1, …, K} определенного через X, то

\text{[math]}

X\mid \beta \sim \operatorname {Dir} (\alpha +\beta ).

Эта связь используется в Байесовской статистике для того, чтобы оценить скрытые параметры, X, дискретного вероятностного распределения, имея набор из n выборок. Очевидно, если априорное распределение обозначено как Dir(α), то Dir(α + β) есть апостериорное распределение после серии наблюдений с гистограммой β.

Связи с другими распределениямиПравить

Если для $\text{[math]}$ $\text{[math]}$ $i\in \{1,2,\ldots ,K\},$

\text{[math]}

Y_{i}\sim \operatorname {Gamma} ({\textrm {shape}}=\alpha _{i},{\textrm {scale}}=1)

независимо, то

\text{[math]}

V=\sum _{i=1}^{K}Y_{i}\sim \operatorname {Gamma} ({\textrm {shape}}=\sum _{i=1}^{K}\alpha _{i},{\textrm {scale}}=1),

и

\text{[math]}

(X_{1},\ldots ,X_{K})=(Y_{1}/V,\ldots ,Y_{K}/V)\sim \operatorname {Dir} (\alpha _{1},\ldots ,\alpha _{K}).

Несмотря на то, что X_i не являются независимыми друг от друга, они могут быть сгенерированы из набора из $\text{[math]}$ $\text{[math]}$ $K$ независимых гамма случайных величин. К несчастью, так как сумма $\text{[math]}$ $\text{[math]}$ $V$ теряется в процессе формирования X = (X₁, …, X_K), становится невозможно восстановить начальные значения гамма случайных величин только по этим значениям. Тем не менее, благодаря тому, что работать с независимыми случайными величинами проще, это преобразование параметров может быть полезно при доказательстве свойств распределения Дирихле.

Генерация случайных чиселПравить

Метод построения случайного вектора $\text{[math]}$ $\text{[math]}$ $x=(x_{1},\ldots ,x_{K})$ для распределения Дирихле размерности K с параметрами $\text{[math]}$ $\text{[math]}$ $(\alpha _{1},\ldots ,\alpha _{K})$ следует непосредственно из этой связи. Сначала получим K независимых случайных выборок $\text{[math]}$ $\text{[math]}$ $y_{1},\ldots ,y_{K}$ из гамма-распределений, каждое из которых имеет плотность

\text{[math]}

{\frac {y_{i}^{\alpha _{i}-1}\;e^{-y_{i}}}{\Gamma (\alpha _{i})}},

а затем положим

\text{[math]}

x_{i}=y_{i}\left/\sum _{j=1}^{K}y_{j}\right..

Наглядная трактовка параметровПравить

В качестве примера использования распределения Дирихле можно предложить задачу, в которой требуется разрезать нитки (каждая начальной длины 1,0) на K частей с разными длинами так, чтобы все части имели заданную среднюю длину, но с возможностью некоторой вариации относительных длин частей. Значения α / α₀ определяют средние длины частей нитки, получившиеся из распределения. Дисперсия вокруг среднего значения обратно пропорциональна α₀.

См. такжеПравить

ПримечанияПравить

↑ ¹ ² Гроот, 1974, с. 56—58.

ЛитератураПравить

М. де Гроот^ru_en. Оптимальные статистические решения = Optimal Statistical Decisions. — М.: Мир, 1974. — 492 с.

[_90a82d52948d947d-1] ¹ ² Гроот, 1974, с. 56—58.

[1]