next up previous
次へ: 学習結果の評価 上へ: 実験の手順 戻る: EM アルゴリズムによる学習

画像に対する属性の出力

学習サンプルを混合線形 分布と EM アルゴリズムによって得られた パラメータにしたがって,属性数($K$ 個)のクラスに分類しておく. 具体的には,各サンプルに対して,属性の条件つき分布 $q(k\mid\mbox{\boldmath$y$},\mbox{\boldmath$x$},\mbox{\boldmath$\theta$})$ を最大にするような $k$ を割り当てる.

新たに,画像特徴が与えられたときには,画像特徴をまず正準空間に射影した後, EM アルゴリズムによって得られたパラメータにしたがって音声特徴の正準空間に 1対多のマッピングを行ない,属性数だけの出力を得る. それぞれの出力に対して, その空間の中で最も近い音声特徴をあらかじめクラス分けしておいた学習サンプル の中から選ぶ(nearest neighbor 法). 音声データを蓄えておき,この特徴に対応する音声を再生させることもできるが, 今回は音声再生はインプリメントを行なわず,選ばれた 音声特徴の真のラベルを見て画像特徴にマッチしているかどうかの評価を行なった.



Shotaro Akaho 平成15年7月22日