本稿の一番最初に述べたように,機械学習の幾何的意味というのは 観測されたデータをモデルの空間に射影することである. 情報幾何では,データとモデルの両方を含む大きな確率分布の空間は, 双対平坦なもの(指数分布族など)を考え,モデルをその部分空間で, データを経験分布に対応するの点として位置づける. 以下では部分空間の性質と,射影について説明する.
ユークリッド空間でも,平らな部分空間への射影は曲がった部分空間への 射影よりも易しい. 情報幾何でも平坦な部分空間は重要な概念である. 双対平坦な空間があったとき,その-座標系での平らな部分空間 (つまり線形部分空間)を-平坦な部分空間という11. ここで注意を要するのは,自身の平坦性と異なり, -平坦な部分空間だからといって-平坦とは限らないことであ る.
さて,部分空間への射影を考える際に重要な概念がダイバージェンスである. 双対平坦な空間の 2点,の間 の-ダイバージェンスは ルジャンドル変換の式(11)に類似した以下の式で定義される.
(15) |
特に,指数分布族を考えると,そのでの-ダイバージェンス は二つの分布とのカルバックダイバージェンス
(16) |
ユークリッド空間での射影が簡単な理由の一つは,ある点から部分空間内の点への 距離が直交方向への距離成分と部分空間内の距離成分に分解できる ことにある(ピタゴラスの定理). 情報幾何の場合も,次のように拡張されたピタゴラスの定理が成り立つ.
(17) |
射影定理により,が-平坦な部分空間の場合, -射影を取るのが自然である. その場合,以下のように,の中と 外とで-座標と-座標を分けて取る方が,皆まっすぐな 世界になるのでわかりやすい.
が次元の-平坦な部分空間の時,座標成分を最初の 個と残りの個に分けて, , とおこう. あらかじめ に適当に線形変換を施しておくことにより, は (定数)を満たす線形部分空間となるように できる(図5). ここで新たに, という混合座標系という二つの座標系を混ぜたものを考える. の任意の点はこの混合座標を用いても一意的に表現される. 混合座標を用いると, からへの -射影は単に後半を でおきかえた で求められ, -射影の具体的な表示が得られる.