問題構造とは何か

次へ: [ナイーブなEDA] 上へ: 確率構造探索と最適化 戻る: 確率構造探索と最適化索引

問題構造とは何か

今まで「問題構造」という漠然とした用語を使ってきたが，ここでは統計モデル，つまり統計的な学習の対象となるような構造のことを指すことにする．見かけ複雑な構造をした関数も，内在的に十分簡単な (=統計的学習が可能な)構造を持っているというという仮定に立った立場である．

ここで，何を学習するかについていくつかの自由度がある．一つは MCMC などが対象とする確率分布そのもののモデル化が考えられる．

$\displaystyle p_T(x) \simeq p(x;\theta)$

(16)

ここで $\theta$ はパラメータである．

そのものに従うサンプルを得るのは難しくても $p(x;\theta)$ が

を十分よく近似し，かつサンプリングをするのが簡単な分布であれば，その分布を学習することによりサンプリングが楽になるだろう．後で述べる平均場近似を用いた手法は基本的にはこの立場である．

ただし，そのものは複雑過ぎて単純な分布では近似できないことも多い．そのような場合に，最適化のためには全体を近似する必要はなく，が小さな値をとるようながもれなくサンプリングされればよいという考え方も出来る．全体を近似するのは難しくても，が小さいところに限定すれば比較的少ないパラメータの分布で記述可能かもしれない．また，が小さいところが MCMC のランダムウォークの障壁になっている場合には，これを忠実に実現するよりは多少の下駄を履かせて障壁を除くようにしたほうがよいようにも思える．

EDA は基本的に後者のようにの小さいところに限定してサンプルを得ようという考え方であり，そのナイーブな実現法として以下のようなものが考えられる．

Subsections

- [ナイーブなEDA]

Shotaro Akaho 平成19年6月13日