[ English | Japanese ]


無伴奏歌唱におけるブレスの音響特性とそれに基づく自動ブレス検出

This project is proposed and researched by Tomoyasu Nakano, Jun Ogata, Masataka Goto, and Yuzuru Hiraga.


Abstract:

本研究では、歌唱音声のブレス(吸気、息継ぎ)音を対象として、音響特性の分析とその結果に基づく自動ブレス検出法の実現を目的とする。従来、朗読音声や歌唱音声のブレスを検出する研究はあったが、その音響特性は比較的単純な指標しか示されていなかった。そこで本研究では、まずブレス音の音響特性を詳細に検討するために、18人の歌手が歌った128分の歌唱データ(1488箇所のブレス)を用いて分析を行った。その結果、ブレス音のスペクトル包絡形状が同一曲中で類似していること、その長時間平均には1.6kHz(男性),1.7kHz(女性)付近に顕著なピークが認められることを示す。また、音響特性に基づく自動ブレス検出の第一段階として、MFCC, ΔMFCC, Δパワーを特徴量としたHMMを用いた検出実験を行った。27曲分の歌唱音声を対象に実験した結果、本手法は再現率と精度それぞれについて97.5%, 77.7%を得た。


Acknowledgments:

本研究では、RWC 研究用音楽データベース (ポピュラー音楽 RWC-MDB-P-2001)、 AISTハミングデータベースを使用しました。

本研究に対し有益な議論をして頂いた、藤原 弘将 氏(産総研)、齋藤 毅 氏(産総研) に感謝致します。


Reference:

  1. Tomoyasu Nakano, Jun Ogata, Masataka Goto, and Yuzuru Hiraga:
    Analysis and Automatic Detection of Breath Sounds in Unaccompanied Singing Voice,
    in Proceedings of the 10th International Conference on Music Perception and Cognition (ICMPC10),
    pp.387-390, 2008.
    [Paper PDF]
  2. 中野 倫靖, 後藤真孝, 緒方淳, 平賀譲:
    無伴奏歌唱におけるブレスの音響特性とそれに基づく自動ブレス検出,
    情報処理学会 音楽情報科学研究会 研究報告 2008-MUS-76, vol.2008, no.50, pp.83-88, July 2008.
    [論文PDF]
  3. 西村 竜一, 伊藤 丈一, 内村 佳典, 川添 正人, 剣持 秀紀, 浜中 雅俊, 宮本 賢一, 梅本 暁, 森勢 将雅, 中野 倫靖, 大石 康智, 高橋 量衛, 野池 賢二, 戸田 智基, 梶 克彦:
    デモンストレーション: 音楽・音声言語情報処理の研究紹介,
    情報処理学会 研究報告 2008-MUS-74,
    vol.2008, no.12, pp.59-66, 2008.
  4. 中野 倫靖, 緒方淳, 後藤真孝, 平賀譲:
    無伴奏歌唱におけるブレスの音響特性と自動検出,
    日本音響学会 2008年 春季研究発表会講演論文集,
    1-11-12, pp.265-268, March 2008.
    [論文PDF]

The copyright of each publication is retained by the corresponding academic society (copyright holder). The IPSJ publications are published on this web site under the copyright guidelines of the IPSJ (in Japanese).


Tomoyasu Nakano, Jun Ogata, Masataka Goto, and Yuzuru Hiraga.