次へ: 位置・尺度・回転パラメータ 上へ: 確率分布の位置, 尺度, 回転パラメータの学習法 戻る: 確率分布の位置, 尺度, 回転パラメータの学習法

はじめに

本章では，任意の形の確率分布が与えられた時に，その位置・尺度等を調整してデータにもっともあてはまるようなパラメータを学習する手法について考える．位置や尺度パラメータをもつ確率分布に関する学習は，ロバスト推定 [39]やセミパラメトリック推定[26]といった統計的推定の枠組の中でも基本的な問題である．また，空間上に分布するデータ点の集合にあらかじめ形のわかっている確率モデルを伸縮してあてはめる問題はテンプレートマッチングなど統計的パターン認識[40]などにも幅広く応用されている．

しかしながら，このようなモデルでは，正規分布のような数少ない例外を除き，一般に位置や尺度パラメータの推定は容易ではない．これは， 3 章で述べたように，幾何学的にはモデルの空間が曲がっていることに起因している．ロバスト推定では正規分布以外の分布が用いられるので，一般にパラメータ推定は Newton 法や勾配法で行われ，場合によっては安定性や速度の点で問題が生じることがある．さらに，テンプレートマッチングでは，複雑な形状を当てはめることが多いので勾配法は適用するのが困難で，全探索やランダム探索を行わざるを得ないこともある．

さて，3.4 で， EM アルゴリズムが複雑な確率モデルの学習を単純化できる場合があることを述べた．そこで，本章では混合分布に対する EM アルゴリズムを応用して，位置・尺度パラメータの学習アルゴリズムを導く．まず，あらかじめ与えられた確率分布を正規混合分布で近似しておく．これは正規混合分布のノンパラメトリック推定としての性質から任意に必要な精度で行うことが可能である[85]．その上で，与えられたサンプルに対し，その正規混合分布を伸縮して学習を行う．ただし，この場合位置や尺度のパラメータは正規混合分布の独立したパラメータではなく，非線形な部分多様体をなしているため，単純な正規混合分布のように閉じた形のアルゴリズムを求めることは困難である．そこで，近似を行う正規混合分布を特別なクラスに限定した上で，一般化EM アルゴリズムの一種である ECM アルゴリズム(3.4.6 参照)を適用し，位置パラメータと尺度パラメータを順に最適化することにすると，推定アルゴリズムが 2 次方程式の解として閉じた形で得ることができることを示す．

EM アルゴリズムを用いると，尤度が単調に増加し，Newton 法などに比べて安定性が高く，単純な勾配法に比べて速度の点でも優れたアルゴリズムが得られる．また，もう一つの利点として，複数のモデルに対するデータあてはめに対して自然に拡張できることが挙げられる．つまり，位置や尺度のパラメータをもつ分布が複数個あったときに，それらの混合分布として全体の分布をモデル化し，階層的に EM アルゴリズムを適用することによって学習を行うことができるということである．これは，Jordan らによって提案された階層的エキスパートネットワーク[41,43]の階層的なアプローチと類似のもので，基本的にはどちらも 3.4.5 に述べた重み付きの最尤推定を再帰的に行えばよい．しかしながら，彼らの手法が往々にしてパラメータ数過剰になりやすいのに対し，本論文での手法は位置や尺度といった本質的なパラメータのみに限定している点が異なる．

また，複数個のモデルがないような場合でも，モデル以外に存在するばらまきノイズを一様分布とみなして，モデルと一様分布の混合分布モデル(一種の汚染モデル[39])の学習を行うと，ノイズに対してロバストな推定法が得られる．

以下では，まず最初に 2 種類の確率モデルを導入する．一つは任意の次元の位置-尺度モデル[2]であり，もう一つは物体認識など応用上重要と思われる 2 次元のモデルで位置と尺度のほかに回転のパラメータを含むモデルである．次に，これらのモデルを適当なクラスに属する正規混合分布で近似し，ECM アルゴリズムを用いてパラメータ推定する方法について述べる．さらに，導かれたアルゴリズムが正しく動作することを示すために，複数モデルのあてはめなどを含めた簡単な実験を行う．

Shotaro Akaho 平成15年7月22日