自然発話中の言い淀み(有声休止)箇所のリアルタイム検出

Filled Pause Display

This project is proposed and researched by Masataka Goto and Katunobu Itou.

English version is here.


本研究では、 代表的な言い淀み現象である有声休止(音節の引き延ばしも含む)を 自動的に検出する手法を実現した。 有声休止は音声対話において発話権の保持等の大切な役割を果たしており、 その検出は音声対話システムを実現する上で重要である。 従来、 サブワード単位に基づく連続音声認識やワードスポッティングの枠組みで 有声休止に対処する研究事例はあったが、 言い淀み現象として個々に検出しておらず、 その役割を把握して適切に扱うことはできなかった。 本手法は、 有声休止中は調音器官の変化が小さいことに着目し、 音韻的に変化が少ない持続した有声音(有声休止音)を検出する。 その際、ボトムアップな信号処理によって、 有声休止音が持つ二つの音響的特徴 (基本周波数の変動が小さくスペクトル包絡の変形が小さい)を検出することで、 トップダウン情報を使わない言語非依存な検出を可能とする。 本手法をリアルタイムに実行するシステムを実装し、 有声休止箇所のマーク付け作業を施した日本語の音声対話コーパスを用意して、 評価実験をおこなった。 その結果、 30名の話者の自然発話に対し、 高い精度で有声休止を検出できることが確認された。


References:

  1. 後藤 真孝, 伊藤 克亘, 速水 悟: "自然発話中の有声休止箇所のリアルタイム検出システム", 電子情報通信学会論文誌 D-II, Vol.J83-D-II, No.11, pp.2330-2340, November 2000.
  2. 後藤 真孝, 伊藤 克亘, 速水 悟: "有声休止箇所のリアルタイム検出システムの評価", 日本音響学会 2000年春季研究発表会 講演論文集, 3-8-8, pp.81-82, March 2000.
  3. Masataka Goto, Katunobu Itou, and Satoru Hayamizu: A Real-time Filled Pause Detection System: Toward Spontaneous Speech Dialogue, 2000 RWC Symposium Proceedings (RWC Technical Report), TR-99-002, pp.187-192, January 2000.
  4. 後藤 真孝, 伊藤 克亘, 速水 悟: "自発的な発話中の言い淀み(有声休止)箇所のリアルタイム検出", 日本音響学会 1999年秋季研究発表会 講演論文集, 3-1-5, pp.105-106, October 1999.
    PDF
  5. Masataka Goto, Katunobu Itou, and Satoru Hayamizu: A Real-time Filled Pause Detection System for Spontaneous Speech Recognition, Proceedings of the 6th European Conference on Speech Communication and Technology (Eurospeech '99), pp.227-230, September 1999.
    PDF
  6. 後藤 真孝, 伊藤 克亘, 速水 悟: "自然発話中の言い淀み箇所のリアルタイム検出システム", 情報処理学会 音声言語情報処理研究会 研究報告 99-SLP-27-2, Vol.99, No.64, July 1999.
    PDF


Back to:


Please E-mail comments and questions to
Masataka GOTO <m.goto [at] aist.go.jp>

All pages are copyrighted by the author. Unauthorized reproduction is strictly prohibited.
last update: May 11, 2000