音楽音響信号を対象としたメロディーとベースの音高推定

F0 Display

This project is proposed and researched by Masataka Goto.

English version is here.


本研究では、 複数の楽器音が混在したモノラルの音楽音響信号に対して、 メロディーとベースの音高(基本周波数)を推定する手法を実現した。 従来の音高推定手法や音源分離手法は、 高々三つの音の混合音しか扱うことができず、 市販のCDによるジャズやポピュラー音楽の音響信号には有効に機能しなかった。 我々の手法は、 安定に抽出できない基本周波数成分には依存せず、 意図的に制限した周波数帯域 (メロディーは中高域、ベースは低域) にある高調波成分が支持する最も優勢な音高を求める。 その際、 音源数を仮定せずにあらゆる音高の高調波構造が混在しているとみなして 混合音をモデル化し、 EM (Expectation-Maximization)アルゴリズムにより 各高調波構造が相対的にどれくらい優勢かを推定する。 さらに、 マルチエージェントモデルを導入し、 各エージェントが音高の時間的な軌跡を追跡することで、 最も優勢で安定な音高の軌跡を得ることができる。 本手法に基づくシステムを実装して実験した結果、 市販のCDからサンプリングした実世界の音響信号に対し、 メロディーとベースの音高をリアルタイムに推定できることを確認した。


References:

  1. Masataka Goto: A Real-time Music Scene Description System: Predominant-F0 Estimation for Detecting Melody and Bass Lines in Real-world Audio Signals, Speech Communication (ISCA Journal), Vol.43, No.4, pp.311-329, September 2004.
    PDF
  2. Masataka Goto: A Predominant-F0 Estimation Method for Polyphonic Musical Audio Signals, Proceedings of the 18th International Congress on Acoustics (ICA 2004), pp.II-1085-1088, April 2004. (Invited Paper)
    PDF
  3. Masataka Goto, A Predominant-F0 Estimation Method for Real-world Musical Audio Signals: MAP Estimation for Incorporating Prior Knowledge about F0s and Tone Models, Proceedings of CRAC-2001 (Workshop on Consistent & Reliable Acoustic Cues for Sound Analysis), September 2001.
    PDF
  4. Masataka Goto: A Predominant-F0 Estimation Method for CD Recordings: MAP Estimation using EM Algorithm for Adaptive Tone Models, Proceedings of the 2001 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2001), pp.V-3365-3368, May 2001.
    PDF
  5. 後藤 真孝: "音楽音響信号を対象としたメロディーとベースの音高推定", 電子情報通信学会論文誌 D-II, Vol.J84-D-II, No.1, pp.12-22, January 2001.
  6. 後藤 真孝: "リアルタイム音楽情景記述システム: 全体構想と音高推定手法の拡張", 情報処理学会 音楽情報科学研究会 研究報告 2000-MUS-37-2, Vol.2000, No.94, pp.9-16, October 2000.
  7. Masataka Goto: A Robust Predominant-F0 Estimation Method for Real-time Detection of Melody and Bass Lines in CD Recordings, Proceedings of the 2000 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2000), pp.II-757-760, June 2000.
    PDF
  8. Masataka Goto: Music Scene Description: A Predominant-F0 Estimation Method for Detecting Melody and Bass Lines, 人工知能学会研究会資料 AIチャレンジ研究会, SIG-Challenge-9907-8, pp.45-52, November 1999.
  9. Masataka Goto and Satoru Hayamizu: A Real-time Music Scene Description System: Detecting Melody and Bass Lines in Audio Signals, Working Notes of the IJCAI-99 Workshop on Computational Auditory Scene Analysis, pp.31-40, August 1999.
    PDF
  10. 後藤 真孝: "実世界の音楽音響信号を対象としたメロディーとベースの音高推定", 情報処理学会 音楽情報科学研究会 研究報告 99-MUS-31-16, Vol.99, No.68, August 1999.
    PDF


Back to:


Please E-mail comments and questions to
Masataka GOTO <m.goto [at] aist.go.jp>

All pages are copyrighted by the author. Unauthorized reproduction is strictly prohibited.
last update: May 11, 2000