しかしながら,このようなモデルでは,正規分布のような数少ない例外を除き,一 般に位置や尺度パラメータの推定は容易ではない.これは, 3 章で述べたように,幾何学的にはモデルの空間が曲がっ ていることに起因している.ロバスト推定では正規分布以外の分布が用いられ るので,一般にパラメータ推定は Newton 法や勾配法で行われ,場合によって は安定性や速度の点で問題が生じることがある. さらに,テンプレートマッ チングでは,複雑な形状を当てはめることが多いので勾配法は適用するのが困 難で,全探索やランダム探索を行わざるを得ないこともある.
さて,3.4 で, EM アルゴリズムが複雑な確率モデルの 学習を単純化できる場合があることを述べた.そこで,本章では混合分布に対 する EM アルゴリズムを応用して,位置・尺度パラメータの学習アルゴリズム を導く.まず,あらかじめ与えられた確率分布を正規混合分布で近似しておく. これは正規混合分布のノンパラメトリック推定としての性質から任意に必要な 精度で行うことが可能である[85].その上で,与えられたサンプ ルに対し,その正規混合分布を伸縮して学習を行う.ただし,この場合位置や 尺度のパラメータは正規混合分布の独立したパラメータではなく, 非線形な部分多様体をなしているため,単純な正規混合分布のように閉じた形 のアルゴリズムを求めることは困難である.そこで,近似を行う正規混合分布 を特別なクラスに限定した上で,一般化EM アルゴリズムの一種である ECM ア ルゴリズム(3.4.6 参照)を適用し,位置パラメータと尺 度パラメータを順に最適化することにすると,推定アルゴリズムが 2 次方程 式の解として閉じた形で得ることができることを示す.
EM アルゴリズムを用いると,尤度が単調に増加し,Newton 法などに比べて安 定性が高く,単純な勾配法に比べて速度の点でも優れたアルゴリズムが得られ る.また,もう一つの利点として,複数のモデルに対するデータあてはめに対 して自然に拡張できることが挙げられる. つまり,位置や尺度のパラメータ をもつ分布が複数個あったときに,それらの混合分布として全体の分布をモデ ル化し,階層的に EM アルゴリズムを適用することによって学習を行うことが できるということである.これは,Jordan らによって提案された階層的エキ スパートネットワーク[41,43]の階層的なアプロー チと類似のもので,基本的にはどちらも 3.4.5 に 述べた重み付きの最尤推定を再帰的に行えばよい.しかしながら,彼らの手法 が往々にしてパラメータ数過剰になりやすいのに対し,本論文での手法は位置や 尺度といった本質的なパラメータのみに限定している点が異なる.
また,複数個のモデルがないような場合でも,モデル以外に存在するばらまき ノイズを一様分布とみなして,モデルと一様分布の混合分布モデル(一種の汚 染モデル[39])の学習を行うと,ノイズに対してロバストな推定法 が得られる.
以下では,まず最初に 2 種類の確率モデルを導入する. 一つは任意の次元の 位置-尺度モデル[2]であり,もう一つは物体認識など応用上 重要と思われる 2 次元のモデルで位置と尺度のほかに回転のパラメータを含 むモデルである.次に,これらのモデルを適当なクラスに属する正規混合分布 で近似し,ECM アルゴリズムを用いてパラメータ推定する方法について述べる. さらに,導かれたアルゴリズムが正しく動作することを示すために,複数モデ ルのあてはめなどを含めた簡単な実験を行う.