有限状態文法音声認識

有限状態文法音声認識エンジンは、入力音声に対して最大尤度を与える単語系列を有限状態文法に基づいて探索する音声認識エンジンです。

上図の黄緑色のノードを結んで構成したグラフが有限状態文法を表現しています。各ノードには複数の単語が登録されており、有限状態文法の始点から終点までノード間を遷移するときに、各ノードに登録されている複数の単語の中から1つの単語が選ばれます。

例えば、

のように登録した場合、

などの発話を認識することができるようになります。

この有限状態文法音声認識エンジンに、HMMに基づいた雑音重畳音声の特徴補正法を組み込むことで、雑音に対して頑健な音声認識を実現しています。

関連文献リスト


Copyright(c) 2007 Akira Sasou All Rights Reserved.