Алгоритм Баума — Велша

Алгоритм Баума — Велша используется в информатике и статистике для нахождения неизвестных параметров скрытой марковской модели (HMM). Он использует алгоритм прямого-обратного хода и является частным случаем обобщённого EM-алгоритма.

Алгоритм Баума — Велша оценки скрытой модели МарковаПравить

Скрытая модель Маркова — это вероятностная модель множества случайных переменных $\text{[math]}$ $\text{[math]}$ $\{Y_{1},\;\ldots ,\;Y_{t},\;Q_{1},\;\ldots ,\;Q_{t}\}$ . Переменные $\text{[math]}$ $\text{[math]}$ $Y_{t}$ — известные дискретные наблюдения, а $\text{[math]}$ $\text{[math]}$ $Q_{t}$ — «скрытые» дискретные величины. В рамках скрытой модели Маркова есть два независимых утверждения, обеспечивающих сходимость данного алгоритма:

$\text{[math]}$ $\text{[math]}$ $t$ -я скрытая переменная при известной $\text{[math]}$ $\text{[math]}$ $(t-1)$ -ой переменной независима от всех предыдущих $\text{[math]}$ $\text{[math]}$ $(t-1)$ переменных, то есть $\text{[math]}$ $\text{[math]}$ $P(Q_{t}\mid Q_{t-1},\;Y_{t-1},\;\ldots ,\;Q_{1},\;Y_{1})=P(Q_{t}\mid Q_{t-1})$ ;
$\text{[math]}$ $\text{[math]}$ $t$ -е известное наблюдение зависит только от $\text{[math]}$ $\text{[math]}$ $t$ -го состояния, то есть не зависит от времени, $\text{[math]}$ $\text{[math]}$ $P(Y_{t}\mid Q_{t},\;Q_{t-1},\;Y_{t-1},\;\ldots ,\;Q_{1},\;Y_{1})=P(Y_{t}\mid Q_{t})$ .

Далее будет предложен алгоритм «предположений и максимизаций» для поиска максимальной вероятностной оценки параметров скрытой модели Маркова при заданном наборе наблюдений. Этот алгоритм также известен как алгоритм Баума — Велша.

$\text{[math]}$ $\text{[math]}$ $Q_{t}$ — это дискретная случайная переменная, принимающая одно из $\text{[math]}$ $\text{[math]}$ $N$ значений $\text{[math]}$ $\text{[math]}$ $(1\ldots N)$ . Будем полагать, что данная модель Маркова, определённая как $\text{[math]}$ $\text{[math]}$ $P(Q_{t}\mid Q_{t-1})$ , однородна по времени, то есть независима от $\text{[math]}$ $\text{[math]}$ $t$ . Тогда можно задать $\text{[math]}$ $\text{[math]}$ $P(Q_{t}\mid Q_{t-1})$ как независящую от времени стохастическую матрицу перемещений $\text{[math]}$ $\text{[math]}$ $A=\{a_{ij}\}=p(Q_{t}=j\mid Q_{t-1}=i)$ . Вероятности состояний в момент времени $\text{[math]}$ $\text{[math]}$ $t=1$ определяется начальным распределением $\text{[math]}$ $\text{[math]}$ $\pi _{i}=P(Q_{1}=i)$ .

Будем считать, что мы в состоянии $\text{[math]}$ $\text{[math]}$ $j$ в момент времени $\text{[math]}$ $\text{[math]}$ $t$ , если $\text{[math]}$ $\text{[math]}$ $Q_{t}=j$ . Последовательность состояний выражается как $\text{[math]}$ $\text{[math]}$ $q=(q_{1},\;\ldots ,\;q_{T})$ , где $\text{[math]}$ $\text{[math]}$ $q_{t}\in \{1\ldots N\}$ является состоянием в момент $\text{[math]}$ $\text{[math]}$ $t$ .

Наблюдение $\text{[math]}$ $\text{[math]}$ $Y_{t}$ в момент времени $\text{[math]}$ $\text{[math]}$ $t$ может иметь одно из $\text{[math]}$ $\text{[math]}$ $L$ возможных значений, $\text{[math]}$ $\text{[math]}$ $y_{t}\in \{o_{1},\;\ldots ,\;o_{L}\}$ . Вероятность заданного вектора наблюдений в момент времени $\text{[math]}$ $\text{[math]}$ $t$ для состояния $\text{[math]}$ $\text{[math]}$ $j$ определяется как $\text{[math]}$ $\text{[math]}$ $b_{j}(o_{i})=P(Y_{t}=o_{i}\mid Q_{t}=j)$ ( $\text{[math]}$ $\text{[math]}$ $B=\{b_{ij}\}$ — это матрица $\text{[math]}$ $\text{[math]}$ $L$ на $\text{[math]}$ $\text{[math]}$ $N$ ). Последовательность наблюдений $\text{[math]}$ $\text{[math]}$ $y$ выражается как $\text{[math]}$ $\text{[math]}$ $y=(y_{1},\;\ldots ,\;y_{T})$ .

Следовательно, мы можем описать скрытую модель Маркова с помощью $\text{[math]}$ $\text{[math]}$ $\lambda =(A\;,B,\;\pi )$ . При заданном векторе наблюдений $\text{[math]}$ $\text{[math]}$ $y$ алгоритм Баума — Велша находит $\text{[math]}$ $\text{[math]}$ $\lambda ^{*}=arg\max _{\lambda }P(y\mid \lambda )$ . $\text{[math]}$ $\text{[math]}$ $\lambda ^{*}$ максимизирует вероятность наблюдений $\text{[math]}$ $\text{[math]}$ $y$ .

АлгоритмПравить

Исходные данные: $\text{[math]}$ $\text{[math]}$ $\lambda =(A,\;B,\;\pi )$ со случайными начальными условиями.

Алгоритм итеративно обновляет параметр $\text{[math]}$ $\text{[math]}$ $\lambda$ до схождения в одной точке.

Прямая процедураПравить

Обозначим через $\text{[math]}$ $\text{[math]}$ $\alpha _{i}(t)=p(Y_{1}=y_{1},\;\ldots ,\;Y_{t}=y_{t},\;Q_{t}=i\mid \lambda )$ вероятность появления заданной последовательности $\text{[math]}$ $\text{[math]}$ $y_{1},\;\ldots ,\;y_{t}$ для состояния $\text{[math]}$ $\text{[math]}$ $i$ в момент времени $\text{[math]}$ $\text{[math]}$ $t$ .

$\text{[math]}$ $\text{[math]}$ $\alpha _{i}(t)$ можно вычислить рекурсивно:

$\text{[math]}$ $\text{[math]}$ $\alpha _{i}(1)=\pi _{i}\cdot b_{i}(y_{1});$
$\text{[math]}$ $\text{[math]}$ $\alpha _{j}(t+1)=b_{j}(y_{t+1})\sum _{i=1}^{N}{\alpha _{i}(t)\cdot a_{ij}}.$

Обратная процедураПравить

Данная процедура позволяет вычислить $\text{[math]}$ $\text{[math]}$ $\beta _{i}(t)=p(Y_{t+1}=y_{t+1},\ldots ,Y_{T}=y_{T}\mid Q_{t}=i,\lambda )$ вероятность конечной заданной последовательности $\text{[math]}$ $\text{[math]}$ $y_{t+1},\;\ldots ,\;y_{T}$ при условии, что мы начали из исходного состояния $\text{[math]}$ $\text{[math]}$ $i$ , в момент времени $\text{[math]}$ $\text{[math]}$ $t$ .

Можно вычислить $\text{[math]}$ $\text{[math]}$ $\beta _{i}(t)$ :

$\text{[math]}$ $\text{[math]}$ $\beta _{i}(T)=p(Y_{T}=y_{T}\mid Q_{t}=i,\lambda )=1;$
$\text{[math]}$ $\text{[math]}$ $\beta _{i}(t)=\sum _{j=1}^{N}{\beta _{j}(t+1)a_{ij}b_{j}(y_{t+1})}.$

Используя $\text{[math]}$ $\text{[math]}$ $\alpha$ и $\text{[math]}$ $\text{[math]}$ $\beta$ можно вычислить следующие значения:

$\text{[math]}$ $\text{[math]}$ $\gamma _{i}(t)\equiv p(Q_{t}=i\mid y,\;\lambda )={\frac {\alpha _{i}(t)\beta _{i}(t)}{\displaystyle \sum _{j=1}^{N}\alpha _{j}(t)\beta _{j}(t)}},$
$\text{[math]}$ $\text{[math]}$ $\xi _{ij}(t)\equiv p(Q_{t}=i,\;Q_{t+1}=j\mid y,\;\lambda )={\frac {\alpha _{i}(t)a_{ij}\beta _{j}(t+1)b_{j}(y_{t+1})}{\displaystyle \sum _{i=1}^{N}\displaystyle \sum _{j=1}^{N}\alpha _{i}(t)a_{ij}\beta _{j}(t+1)b_{j}(y_{t+1})}}.$

Имея $\text{[math]}$ $\text{[math]}$ $\gamma$ и $\text{[math]}$ $\text{[math]}$ $\xi$ , можно вычислить новые значения параметров модели:

$\text{[math]}$ $\text{[math]}$ ${\bar {\pi }}_{i}=\gamma _{i}(1),$
$\text{[math]}$ $\text{[math]}$ ${\bar {a}}_{ij}={\frac {\displaystyle \sum _{t=1}^{T-1}\xi _{ij}(t)}{\displaystyle \sum _{t=1}^{T-1}\gamma _{i}(t)}},$
$\text{[math]}$ $\text{[math]}$ ${\bar {b}}_{i}(o_{k})={\frac {\displaystyle \sum _{t=1}^{T}\delta _{y_{t},\;o_{k}}\gamma _{i}(t)}{\displaystyle \sum _{t=1}^{T}\gamma _{i}(t)}}.$ ,

где

\text{[math]}

\delta _{y_{t},\;o_{k}}={\begin{cases}1&{\text{если }}y_{t}=o_{k},\\0&{\text{иначе}}\end{cases}}

индикативная функция, и $\text{[math]}$ $\text{[math]}$ $b_{i}^{*}(o_{k})$ ожидаемое количество значений наблюдаемой величины, равных $\text{[math]}$ $\text{[math]}$ $o_{k}$ в состоянии $\text{[math]}$ $\text{[math]}$ $i$ к общему количеству состояний $\text{[math]}$ $\text{[math]}$ $i$ .

Используя новые значения $\text{[math]}$ $\text{[math]}$ $A$ , $\text{[math]}$ $\text{[math]}$ $B$ и $\text{[math]}$ $\text{[math]}$ $\pi$ , итерации продолжаются до схождения.

См. такжеПравить

Алгоритм Витерби

Алгоритм Баума — Велша

Содержание