SmartMusicKIOSK: サビ出し機能付き音楽試聴機
This project is proposed and researched by
Masataka Goto.
English version is here.
Introduction:
本研究では、
試聴のための新たな音楽再生インタフェース
SmartMusicKIOSK を実現した。
CD販売店の店頭で音楽を短時間試聴する際には、
通常の音楽鑑賞における受動的な聴き方と異なり、
試聴者は早送りを何度も繰り返しながらサビを探すことが多い。
しかし、こうした聴き方に対する支援は従来なかった。
本研究では、
サビの区間や楽曲中で繰り返される区間の先頭へジャンプする機能と、
それらの区間の楽曲中での配置を視覚化する機能を提供する。
これにより、
試聴者が手探りでサビを見つける煩わしい作業を不要にし、
試聴者が能動的に聴きたい場所を探す作業を容易にする。
このような、
インタラクティブに楽曲中の再生位置を変更しながら
所望の箇所を見つけられるインタフェースは、
試聴に限らず、
音楽を選んで利用する一般的な目的で有用である。
上記の機能を自動サビ区間検出手法により実現し、
試聴機として実装・運用した結果、
その有効性を確認した。
従来の音楽再生インタフェースでは、
楽曲単位でしか興味のない音楽を飛ばせなかったのに対し、
SmartMusicKIOSK によって初めて、
楽曲内部の興味のない箇所も容易に飛ばすことが可能になったといえる。
タブレットPC上に実装したSmartMusicKIOSK
News! (2004/05/28):
「SmartMusicKIOSK: サビ出し機能付き音楽試聴機」
の研究が、
Nature、American Institute of Physics のニュースサイトで紹介されました。
マスメディア報道:
News! (2004/05/25):
2004年5月25日に
147th Meeting of the Acoustical Society of America
の
特別セッション「Digital Signal Processing Methods for Restoring, Enhancing, and Manipulating Music Recordings」
にて、
招待講演「SmartMusicKIOSK: Music-playback interface
based on a chorus-section detection method」をおこないました。
また、
ASA 147th Meeting Lay Language Papers
のための
lay language paper
の執筆と共に、
同日の
ASA 147th Meeting News Conferences
への参加を依頼されました。
News! (2003/08/01, 09/09):
「SmartMusicKIOSK: サビ出し機能付き音楽試聴機」
の研究が、
2003年8月1日発行の日本経済新聞
朝刊、
2003年9月9日発行の日経流通新聞
で紹介されました。
マスメディア報道:
News! (2003/03/01,07):
2003年2月27日に情報処理学会インタラクション2003
でおこなったロングペーパー発表
「SmartMusicKIOSK: サビ出し機能付き音楽試聴機」が、
同年2月27日に
ベストペーパー賞
を受賞しました。
マスメディア報道:
Background:
店頭でコンパクトディスク(CD)等に記録された音楽を「試聴」するときには、
通常の楽曲全体の受動的な鑑賞とは異なり、聴き手は、
楽曲の再生に能動的に介入して聴きたい部分だけを選びだすという、
音楽との新たなインタラクションをおこなっている。
近年、CD販売店の店頭には、
購入の判断等を目的としてCDを試聴できる音楽試聴機が設置されることが多い。
通常、音楽を聴くときには、その鑑賞が主な目的であるため、
各楽曲を先頭から最後まで通して再生する。
ところが試聴では、自分の探していた楽曲、好みの楽曲であるかどうかを
短時間で判断することが目的であり、
時間的な制約からこうした聴き方をすることは少ない。
例えばポピュラー音楽の場合、楽曲中で一番代表的な盛り上がる主題の部分である
サビ (chorus, refrain) を試聴して判断したいと考えることが多い。
そこで試聴者は、イントロを少し聴いた後に、
サビを探しながら早送りボタンを何度も押して途中を飛ばし、
サビを再生するというような特殊な聴き方をする。
しかし、
従来の音楽CDの試聴機には、このような試聴固有の聴き方を支援する機能はなかった。
試聴機は通常のCDプレーヤ相当の再生操作ボタンを持つが、
その中で、早送りと早戻しのボタンしか、サビの部分を探すために利用できなかった。
一方、最近CD販売店に導入され始めたデジタル試聴機では、
ハードディスクあるいはネットワーク経由で楽曲を再生することができる。
しかし、
楽曲の一部分(通常、先頭の30秒か45秒)だけが
機械的に切り出されて収録されているため、
試聴者はサビの部分を必ずしも聴くことはできなかった。
そこで本研究では、
「サビ出し」機能を搭載した音楽試聴機SmartMusicKIOSKを実現した。
試聴者はこの機能のボタンを押すだけで、
サビの先頭へジャンプする(瞬時に早送りする)ことができ、
自分でサビを探す煩わしい作業から解放される。
Interface:
SmartMusicKIOSKの画面表示
本研究で解くべき問題は、
本来は時間をかけて聴かなければ把握できない音楽に対し、
それを聴く前にどのようにして的確な再生位置の変更を可能にするかである。
そこで、ポピュラー音楽を主な対象と想定して、
以下の二つの解決法を提案する。
-
「サビ出しボタン」 楽曲構造上意味を持つ区間の先頭へ自動ジャンプ
(下側のウィンドウ)
事前に楽曲構造を自動解析しておき、
その中で聴き手が関心を持ちそうな部分へ自動的にジャンプできる機能を提供する。
具体的には、
「サビの区間の頭出し」(NEXT CHORUSボタン)、
「前の楽曲構造の区間の頭出し」(PREV SECTIONボタン)、
「次の楽曲構造の区間の頭出し」(NEXT SECTIONボタン)の機能
を用意しておき、
聴き手がサビの部分だけ聴いたり、
前後の楽曲構造(繰り返し区間)の先頭へとジャンプして聴いたりすることを
可能とする。
-
「音楽地図」 楽曲の内容を反映した視覚化
(上側のウィンドウ)
聴き手がどこへジャンプすればよいかを自分で判断できる手掛かりとして、
楽曲の内容を視覚化する機能を提供する。具体的には、
サビ区間や楽曲中の繰り返し区間の構造(自動サビ区間検出結果)を視覚化する。
上記の図で、横軸は時間軸で楽曲全体を表示しており、
最上段がサビ区間の一覧、その下の5段が繰り返し構造、
その下の横棒が再生位置スライダーを表す。
各段の中で、
着色されている区間同士が似ている(繰り返しである)ことを表している。
例えば、
最下段で短い区間が二カ所着色されているが、
これはこの曲のイントロとエンディングが似ていることを示している。
Chorus-Section Detection:
本研究ではポピュラー音楽の多様な楽曲を扱うため、
サビ固有の音響的な特徴に関する事前情報を一切使わない、
ロバストなサビ区間検出を実現する必要がある。
そこで、
通常はサビ区間が楽曲中で最も多く繰り返されることに着目し、
基本的には、
ある区間の繰り返しを見つけ出し、
最も出現頻度の高い区間を出力する戦略を取る。
しかし、
「繰り返し」と言っても完全に一致する状態で繰り返されることはまれで、
計算機にとっては判断が難しい。
そこで、この問題を解決し、
ポピュラー音楽の音響信号に対して、
サビ区間と繰り返し区間の開始点と終了点を自動検出する手法を実現した。
従来、楽曲の音響信号中に何度も出現するサビのどこか一箇所を、
指定した長さだけ切り出して提示する研究はあったが、
サビ区間の開始点と終了点はわからず、サビの転調も扱えなかった。
本手法は、様々な繰り返し区間の相互関係を調べることで、
楽曲中で繰り返されるすべてのサビ区間を網羅的に検出し、
それらの開始点と終了点を推定できる。
また、転調後でも繰り返しと判断できる類似度を導入することで、
転調を伴うサビも検出できる。
ポピュラー音楽のデータベース(RWC研究用音楽データベース)100曲を用いて
本手法を評価したところ、80曲のサビが検出できた。
Video Clips:
-
SmartMusicKIOSKのデモンストレーションビデオ
-
フルバージョン (high quality):
SmartMusicKIOSKのデモンストレーション
- (47,628,056 bytes, 4 min 24 sec, MPEG-1 file)
-
ショートバージョン - 上記から抜粋 (low quality):
1. 従来の典型的な音楽再生インタフェース
- (10,860,052 bytes, 1 min 02 sec, MPEG-1 file)
2. SmartMusicKIOSK: using NEXT CHORUS button
- (10,306,940 bytes, 0 min 58 sec, MPEG-1 file)
3. SmartMusicKIOSK: using PREV SECTION and NEXT SECTION buttons
- (4,885,048 bytes, 0 min 27 sec, MPEG-1 file)
4. SmartMusicKIOSK: touching directly on a section
- (4,250,596 bytes, 0 min 24 sec, MPEG-1 file)
5. SmartMusicKIOSK: using NEXT TRACK and NEXT CHORUS buttons
- (14,306,544 bytes, 1 min 21 sec, MPEG-1 file)
-
NOTE: "NEXT TRACK"ボタンを押した後の最初の曲
(RWC研究用音楽データベース 楽曲番号 RWC-MDB-P-2001 No. 90) では、
三番目のサビが転調する。また、その次の曲 (RWC-MDB-P-2001 No. 33) では、
三番目のサビの伴奏が大きく変化する。
-
違う楽曲に対するデモンストレーション:
RWC研究用音楽データベース 楽曲番号 RWC-MDB-P-2001 No. 36 を試聴
-
フルバージョン (high quality):
SmartMusicKIOSKのデモンストレーション
- (18,767,876 bytes, 1 min 50 sec, MPEG-1 file)
-
様々なボタンを使用して試聴する例。
三番目のサビの伴奏が大きく変化する。
Screen Snapshots:
「サビの区間の頭出し(NEXT CHORUS)」ボタン |
(A-1) 「再生」ボタンを押して再生を開始
|
(A-2) そのまま再生中
|
(A-3) 「サビの区間の頭出し」ボタンを押して後方のサビ区間の先頭へジャンプ
|
(A-4) 少し再生してから、
さらに「サビの区間の頭出し」ボタンを押して後方のサビ区間の先頭へジャンプ
|
(A-5) さらに「サビの区間の頭出し」ボタンを押して後方のサビ区間の先頭へジャンプ
|
(A-6) 「サビの区間の頭出し」ボタンを最後のサビ区間以降で押すと、最初のサビ区間の先頭へジャンプ
|
「次の楽曲構造の区間の頭出し(NEXT SECTION)」ボタン |
(B-1) 「再生」ボタンを押して再生を開始
|
(B-2) そのまま再生中
|
(B-3) 「次の楽曲構造の区間の頭出し」ボタンを押して直後の区間の先頭へジャンプ
|
(B-4) 少し再生してから、
さらに「次の楽曲構造の区間の頭出し」ボタンを押して直後の区間の先頭へジャンプ
|
(B-5) さらに「次の楽曲構造の区間の頭出し」ボタンを押して直後の区間の先頭へジャンプ
|
|
「前の楽曲構造の区間の頭出し(PREV SECTION)」ボタン |
(C-1) 「再生」ボタンを押して再生を開始
|
(C-2) そのまま再生中
|
(C-3) 「前の楽曲構造の区間の頭出し」ボタンを押して直前の区間の先頭へジャンプ
|
(C-4) さらに「前の楽曲構造の区間の頭出し」ボタンを押して直前の区間の先頭へジャンプ
|
Conclusion:
音楽再生のためのインタフェースは、
CDプレーヤや計算機上のメディアプレーヤの登場後も、
典型的な再生操作ボタン群のまま改良されてこなかったが、
本研究では、そのインタフェースを発展させ、
新たな音楽再生インタフェース SmartMusicKIOSK を提案した。
SmartMusicKIOSKは、従来の楽曲単位での操作体系に対し、
楽曲内部の区間単位での操作体系が追加されたものと位置付けられる。
CDプレーヤーの登場で、
興味のない曲をボタンひと押しで瞬時に飛ばすことが初めて可能になったが、
SmartMusicKIOSKでは、
興味のない楽曲構造上の区間をボタンひと押しで瞬時に飛ばすことを
初めて可能にしたといえる。
こうして原曲の時系列に沿わずに、
「楽曲中の好きなところを聴きたいように聴ける」
ようになったメリットは大きく、
試聴以外の様々な目的でも有用である。
本研究をきっかけに、
音楽再生インタフェースの機能全体が、
改めて再検討される流れが生まれることを期待したい。
Acknowledgments:
本研究は、
RWC研究用音楽データベース
(ポピュラー音楽) RWC-MDB-P-2001 を利用した。
本研究に対し有益な議論をして頂いた、
麻生 英樹 氏 (産業技術総合研究所)に感謝する。
References:
- Masataka Goto:
A Chorus-Section Detection Method for Musical Audio Signals and
Its Application to a Music Listening Station,
IEEE Transactions on Audio, Speech and Language Processing,
Vol.14, No.5, pp.1783-1794, September 2006.
(IEEE server)
- Masataka Goto,
SmartMusicKIOSK:
Music-playback interface based on chorus-section detection method,
The Journal of the Acoustical Society of America,
Vol.115, No.5, Pt.2, p.2494, May 2004.
(Invited Paper of The 147th Meeting of
the Acoustical Society of America)
- Masataka Goto,
Lay Language Paper of ``SmartMusicKIOSK:
Music Listening Station with Chorus-Search Function'',
invited for the
Acoustical Society of America 147th Meeting
Lay Language Papers
and
News Conferences,
May 2004.
- 後藤 真孝:
"SmartMusicKIOSK: サビ出し機能付き音楽試聴機",
情報処理学会論文誌, Vol.44, No.11, pp.2737-2747, November 2003.
(推薦論文)
- Masataka Goto:
SmartMusicKIOSK:
Music Listening Station with Chorus-Search Function,
Proceedings of
the 16th Annual ACM Symposium on User Interface Software and Technology
(UIST 2003),
pp.31-40, November 2003.
- 後藤 真孝:
"SmartMusicKIOSK: サビ区間検出手法に基づく音楽再生インタフェース",
日本音響学会 2003年秋季研究発表会 講演論文集, 1-1-6,
pp.647-648, September 2003.
- Masataka Goto:
A Chorus-Section Detecting Method for Musical Audio Signals,
Proceedings of
the 2003 IEEE International Conference on Acoustics, Speech, and
Signal Processing
(ICASSP 2003),
pp.V-437-440, April 2003.
- 後藤 真孝: "SmartMusicKIOSK: サビ出し機能付き音楽試聴機",
情報処理学会 インタラクション2003論文集, pp.9-16, February 2003.
- 後藤 真孝:
"リアルタイム音楽情景記述システム: サビ区間検出手法",
情報処理学会 音楽情報科学研究会 研究報告 2002-MUS-47-6,
Vol.2002, No.100, pp.27-34, October 2002.
Awards:
- インタラクション2003 (情報処理学会シンポジウム)
ベストペーパー賞 受賞, 2003年2月.
- 情報処理学会 平成16年度論文賞 受賞, 2005年5月.
Back to:
Masataka GOTO
<m.goto [at] aist.go.jp>
All pages are copyrighted by the author.
Unauthorized reproduction is strictly prohibited.
last update: June 2, 2004