学習の目的は汎化,すなわち,有限個の与えられた訓練サンプルにフィットす るだけではなく,背後にある真の確率分布の構造を抽出することにある. 真の 分布が既知ならば,それに対する尤度を最大にするパラメータを求めればよい. しかし実際には真の分布は未知だから, 訓練サンプルだけを用いて真の分布の尤度を推定 しなければならない. そのための方法として,ブートストラップなどのリサン プリングを用いる方法と,訓練サンプルに対する尤度と真の分布に対する尤度 の統計量(期待値など)を評価する方法がある. 本論文で考えるのは後者の方法のうち,竹内の 情報量規準 (TIC) と呼ばれている方法である.
TIC について説明する前に基本的な記号と用語を定義しておく.
訓練サンプル
を発生する未知の
確率分布を とする.
訓練サンプルに対する対数尤度の を経験対数尤度と呼び,
(3.5) |
(3.6) |
(3.7) |