独立なサンプルが与えられた時の混合分布の学習

次へ: 独立な要素分布の場合 上へ: EM アルゴリズム 戻る: 一般的な定式化

独立なサンプルが与えられた時の混合分布の学習

式 (2.1)の一般の混合分布の場合について EM アルゴリズムの具体的な形を示しておく．ただし，の間には(総和が 1 という条件を除き) 関数的な依存関係がないと仮定する．モデルは

$\begin{displaymath} p(x;\ p_k, \theta_k; \ k=1,\ldots,K) = \sum_{k=1}^K p_k f_k(x;\ \theta_k), \end{displaymath}$

(3.27)

である．まず，独立な

個の観測値 $x = x_{(1)},\ldots,x_{(N)}$ が与えられたときの EM アルゴリズムを導く．各観測値がどの要素分布から出てきたか(つまりクラスラベル)がわかれば要素分布ごとに推定を行えばよいので，それを隠れた変数 $k_{(j)}$ と考え，各サンプル $x_{(j)}$ に $k_{(j)}$ をつけ加えたものを完全変数 $y_{(j)} = (x_{(j)}, k_{(j)})$ とする． $y_{(j)}$ の分布は

$\begin{displaymath}p(x_{(j)}, k_{(j)};\ p_{k_{(j)}}, \theta_{k_{(j)}}) = p_{k_{(j)}} f_{k_{(j)}}(x_{(j)}; \theta_{(j)}), \end{displaymath}$

(3.28)

となる．ここで，E ステップを計算するために必要な条件付き確率を

$\begin{displaymath} q\tth (k\mid x_{(j)}) = {p(x_{(j)}, k;\ p_{k}, \theta_{k})\over \sum_{k'=1}^K p(x_{(j)}, k';\ p_{k'}, \theta_{k'})}, \end{displaymath}$