次へ: 独立な要素分布の場合
上へ: EM アルゴリズム
戻る: 一般的な定式化
独立なサンプルが与えられた時の混合分布の学習
式 (2.1)の一般の混合分布の場合について EM アルゴリズム
の具体的な形を示しておく. ただし, の間には(総和が 1 という条件を除き)
関数的な依存関係がないと仮定する. モデルは
|
(3.27) |
である. まず,独立な 個の観測値
が与えられた
ときの EM アルゴリズムを導く. 各観測値がどの要素分布から出てきたか(つ
まりクラスラベル)がわかれば要素分布ごとに推定を行えばよいので,それを
隠れた変数 と考え,各サンプル に
をつけ加えたものを完全
変数
とする. の分布は
|
(3.28) |
となる. ここで,E ステップを計算するために必要な条件付き確率を
|
(3.29) |
と定義しておく.
この値は各繰り返しステップでのパラメータの値から,計算可能な式である.
E ステップにおける は( は離散分布なので積分は総和になり),サンプ
ルの独立性などから,
|
(3.30) |
となる. 続く M ステップでは, を最大化する. まず, について
考えると, に
という条件に対応する Lagrange の未定係数
を加えた関数を で微分し 0 とおく.
すると最終的に,
|
(3.31) |
が得られる. 一方, については,
|
(3.32) |
となる. ちなみに,
完全変数 の分布は については指数分布族の形をしているの
で,式 (3.31) は 式 (3.16)
からも導くことができる.
Shotaro Akaho
平成15年7月22日