next up previous
次へ: EM アルゴリズムによる学習 上へ: 実験の手順 戻る: 学習データ作成

正準相関分析

作成した学習データをもとに画像と音声の間で 正準相関分析を行う. 正準相関分析は本質的な情報だけを残し 余分な次元を落とすのが目的であるが,逆に次元を落としすぎると属性を 分離できなくなってしまう可能性がある. 最適な次数を決定するのは困難だが,本実験ではとりあえず,10 次元とした. 図6.2 は属性数を 3 にしたときの,学習サンプル したときの正準空間での相関の大きさである. 横軸は次元のインデックスを あらわし,縦軸は各次元での相関の大きさを表す. 10 次元というのは,相関がほぼ 0.5 以上になる部分に相当している.

図 6.2: 画像と音声の正準空間での相関(属性の数 3, DataSet(1)). 横軸 : 次元の index(50次元まで),縦軸 : 各次元の相関の大きさ
\begin{figure}\begin{center}
\epsfile{file=intmod/cancor.eps,height=0.5\textheight}
\end{center}\end{figure}



Shotaro Akaho 平成15年7月22日