本チュートリアルではこのようなベイジアンネットについて以下の 基本的な内容を順に説明する予定である。
本チュートリアルでは,今後ますます重要になると思われる,
顧客管理システムや対話的情報システムの中で必要となるユーザモデリング,
大量のデータから隠れた依存構造を発見して様々な予測を行うデータマイ
ニングとしての応用に焦点を当て,ベイジアンネットを適用する場合に必要な
知識とノウハウをできる限り実践的な視点から解説する.
とくに他のデータマイニングや統計的手法である,多変量解析,共分散構造分析,
因子分析,クロス集計表の検定,決定木,ニューラルネットワークとの関連と
相違を見ることで,ベイジアンネットの特長を浮彫りにする.
情報技術は広く社会および個人に浸透し,革新的な変化をもたらしつつある.新
しい応用の拡大,各種センサ技術の発達により,処理すべき情報は単に量の増大のみならず,
質と多様性の増大を伴い,これまでの切り出された閉じた情報の世界を越えて,開かれてダ
イナミックに変化する情報の世界,いわば情報の「実世界化」ともいえる状況をもたらしつ
つある.そして,そうした情報を容易に有効に利用する技術の発展が強く望まれている.
こうした社会的背景とニーズは,情報技術の根底となる枠組からの変革,新たなパラダイム
を要求しつつある.これまでのように固い論理のコンピュータに人間が合わせて近づきつつ
利用するのではなく,コンピュータが人間に近づき,実世界の多様な情報環境において人間
と共存し協調できる,これまでよりもはるかに柔軟な情報処理技術が必要とされている.
本稿では,こうした背景と問題意識を踏まえて,実世界情報処理にむけてのこれまでの筆者
らの取組みと,知能情報処理の変遷,その中で明かになった柔軟な情報処理技術の有望な方
法論の一つであるベイジアンアプローチの重要性について述べる.
ビリーフプロパゲーション(BP)法と類似した枠組みとして物理学では平均場近
似法という計算技法が知られている.近年,特に近似計算の文脈で両枠組みの類似性に着目
した研究が増えているが,実験や観測等,計算量爆発の問題が生じない代替手段により間接
的にであっても結果の検証が可能な物理モデルを対象としてきた平均場近似法の研究はBP
法のそれとは一味違うこともまた事実である.特に,要素数を無限大にした極限で解析的な
取り扱いが容易になる「平均場モデル」に関する研究は大自由度系に対する物理学的接近法
を最も特徴付けるものであろう.本稿では,物理学の視点を際立たせるため,平均場モデル
の典型例である連想記憶モデルへのBP法の適用を考察する.それ自体は情報処理としてさ
ほど意味のあるモデル解析ではないが,i) 計算論的には計算爆発を引き起こすと考えられる
完全2部グラフに対するBP法が物理的考察によって高々要素数の自乗程度の計算量まで削
減され,ii) しかも要素数を増やすほど計算結果が厳密(と予想される)解に近づく例となっ
ており,より実際的な問題の解決法に対して何らかのヒントを与えるかもしれな
い.
本稿では,グラフィカルモデルにおける確率伝搬法を情報幾何学によって表現し
た結果を示す.本研究の目的は,確率伝搬法の解析を行なうための見通しが良い数学的枠組
を与えることである.本稿の結果を発展させることで,確率伝搬法の様々な性質が明らかに
なると考える.なお,本稿の結果は有向,無向を含む全てのグラフィカルモデルに対して成
り立つ.したがって,ベイジアンネット,誤り訂正符号,Beth´e 近似,クラスタ変分法を含
む広いモデルに対して有効である.
LDPC符号や疎なグラフに基づく誤り訂正符号(ターボ符号など)とbelief propagation
に基づく復号アルゴリズムの組み合せは従来達成できなかった驚くべき復号性能の
実現を可能にしている。本稿では、LDPC符号の特長、LDPC符号の流れ、符号理論分野
におけるsum-productアルゴリズムに関する研究の流れ、現在の研究動向などについて
述べる、なお、講演ではこれらのサーベイ的な話題以外についても触れる。