新たに,画像特徴が与えられたときには,画像特徴をまず正準空間に射影した後, EM アルゴリズムによって得られたパラメータにしたがって音声特徴の正準空間に 1対多のマッピングを行ない,属性数だけの出力を得る. それぞれの出力に対して, その空間の中で最も近い音声特徴をあらかじめクラス分けしておいた学習サンプル の中から選ぶ(nearest neighbor 法). 音声データを蓄えておき,この特徴に対応する音声を再生させることもできるが, 今回は音声再生はインプリメントを行なわず,選ばれた 音声特徴の真のラベルを見て画像特徴にマッチしているかどうかの評価を行なった.