次へ: EM アルゴリズムによる学習
上へ: 実験の手順
戻る: 学習データ作成
作成した学習データをもとに画像と音声の間で
正準相関分析を行う. 正準相関分析は本質的な情報だけを残し
余分な次元を落とすのが目的であるが,逆に次元を落としすぎると属性を
分離できなくなってしまう可能性がある.
最適な次数を決定するのは困難だが,本実験ではとりあえず,10 次元とした.
図6.2 は属性数を 3 にしたときの,学習サンプル
したときの正準空間での相関の大きさである. 横軸は次元のインデックスを
あらわし,縦軸は各次元での相関の大きさを表す.
10 次元というのは,相関がほぼ 0.5 以上になる部分に相当している.
図 6.2:
画像と音声の正準空間での相関(属性の数 3, DataSet(1)). 横軸 : 次元の
index(50次元まで),縦軸 : 各次元の相関の大きさ
|
Shotaro Akaho
平成15年7月22日