... 昭太郎1
本稿は「計測と制御」に掲載された原稿に手を加えた物です. (独)産業技術総合研究所 脳神経情報研究部門, 茨城県つくば市梅園1-1-1 中央第2 The National Institute of Advanced Industrial Science and Technology, Central 2, 1-1-1 Umezono Tsukuba-shi Ibaraki 305-8568, Japan
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...である2
$f(x; \boldsymbol{\xi})$$X$ が離散変数なら確率値関数であり,連続変数なら確率密度関数である. 幾何を考える都合上, $f(x; \boldsymbol{\xi})$ は定義域の上で正の値を取ると仮定す る.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...で表せる3
基底の表現法には $\partial/\partial\xi^i$などいろいろな取り方があり,座標変換などを 考える際には便利であるが,本稿では特に必要がないので $\boldsymbol{e}_i$と したまま扱う.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... を表すとする4
$x$が離散変数を含んでいればその部分は総和にする
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... を満たす5
不等号は左辺から右辺を引いたものが正定値に なるという意味である.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... に依存して一意に決まってしまう6
ただし対称性 $\Gamma_{ij}^k =
\Gamma_{ji}^k$を仮定する.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... レビチビタ接続)という7
リーマン接続のもとでは,測地線は2点を 結ぶ最小距離の曲線になっていることも言える.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...-平坦ではない8
ただし,確率の総和が1という条件を外して拡大した空間では$\alpha $-平坦に なる.拡大した空間については3.4も参照.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... で表すことにしよう9
本稿では詳しく説明しないが, 上付き添え字と下付き添え字を区別して双対関係を記述すると便利である. 詳しくはテンソルに関する文献[18]を参照のこと. また,すでに述べたように,$\alpha $-測地線は $\boldsymbol{\theta}$座標での直線, $-\alpha$-測地線は $\boldsymbol{\eta}$座標での直線となる.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 座標変換のヤコビ行列となっている10
すぐわかるように $g_{ij}$$g^{ij}$は互いに逆行列の関係にある.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...$\alpha $-平坦な部分空間という11
空間自体の平坦性と区別するために$\alpha $-自己平行部分空間と 呼ぶこともある.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...だけを規定するとしよう12
実はこれは十分一般的な仮定で,ほとんどの場合 適当な線形変換によりこの形にできる.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... ある13
詳しくは本特集の上田氏の記事を参照. EM は expectation-maximization の頭文字で em は exponential-mixture の頭文字で,偶然同じになっている.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...を取る 14
これは点$p$のパラメータ $\boldsymbol{\theta}(p)$で決まる 十分統計量の条件付き分布 $f(\boldsymbol{r}_H\mid \boldsymbol{r}_V; \boldsymbol{\theta}(p))$ での期待値

$\displaystyle \int f(\boldsymbol{r}_H\mid\boldsymbol{r}_V; \boldsymbol{\theta}(p)) \boldsymbol{r}_H d\boldsymbol{r}_H$ (18)

を表す.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... ある15
$S$を確率分布全体の空間に取れば一般的に等価性が言える. また,異なる場合もサンプル数が増えれば差が小さくなる.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... とする16
$\mathrm{E}_{\mathrm{emp}}
[ \mid x]$は観測データに基づく経験分布での 条件付き期待値を表す.$M$自身が観測データに依存したものになっている ので,通常の統計的推定とはこの意味でも若干異なることに注意.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... になっている17
厳密な 説明は省くが,直感的には,確率分布全体の空間の中では, 指数分布族のように確率分布の$\log$の線形空間が$e$-平坦で, 混合分布族のように確率分布そのものの線形空間が$m$-平坦な部分空間となる. 3.5 でも同様の議論を使う.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... ある18
詳細は省略するが,無向グラフで表したときに,グラフ内に ループがあるような場合に多くの計算量が必要となる.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ikeda02,ikeda04a,ikeda04b 19
基本的に類似な手法だが, クラスタ変分法,TAP 平均場近似,ルーピービリーフプロパゲーション, CCCP 法などといったようにいろいろなバリエーションがある.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.