音声訂正: ``CHOICE'' on Speech

by Jun OGATA  and  Masataka GOTO

音声認識は必ず誤りを起こす!!


本研究では,認識誤りを選択操作だけで訂正することが可能な新しい音声入力インタフェース「音声訂正」を実現した.
音声訂正では,ユーザが音声入力を開始すると,認識結果を単語ごとに区切った表示と,区切られた各区間に対する他候補(競合候補)が発話の最中から次々と画面に描画される.競合候補の個数はその区間の曖昧さを反映し,音声認識結果として信頼性の低い箇所ほど,多数の候補が表示される.ユーザはそれを見ながら,発話中あるいは発話終了後に正しい候補を選択するだけで訂正が可能となる.また,音声訂正では,ユーザが発声中であっても訂正処理が可能な「即時誤り訂正機能」と,ユーザが意図的に発声を休止し,認識処理を一時中断させることが可能な「発話中休止機能」を実現した.

音声訂正は,非言語情報を活用した音声インタフェース「音声補完シリーズ」の第5弾に位置づけられる.


SNAP1.JPG - 58,769BYTES

 

ORANGE.GIF - 325BYTES Video clips

 

ORANGE.GIF - 325BYTES References

ORANGE.GIF - 325BYTES 報道等

 

ORANGE.GIF - 325BYTES 音声補完シリーズ

  1. 音声補完: 言い淀むと助けてくれる音声インタフェース機能
  2. 音声シフト: 声の高さでモードを切り替える音声インタフェース機能
  3. 音声スタータ: 言い淀んで言い始める音声インタフェース機能
  4. 音声スポッタ: 人間同士の会話中に音声認識が利用できる音声インタフェース機能
  5. 音声訂正: 認識誤りを選択操作だけで訂正可能な音声入力インタフェース機能
  6. 音声ペン: 音声認識結果を手書き文字入力で利用できるペン入力インタフェース機能

 


Author: Jun OGATA
Please E-mail to:  jun.ogata(at)aist.go.jp