ご案内: 第二回目のスペシャルセッション「歌声情報処理最前線!!」 (2012年2月3日(金))が開催されます。

情報処理学会 音楽情報科学研究会(夏シンポ2010)イベント企画
スペシャルセッション「歌声情報処理最前線!」
2010年7月28日(水)13:25-18:00 つくばグランドホテル

多くの方々にご覧頂き、どうもありがとうございました!

2010/07/28に開催された「歌声情報処理最前線!」を多くの方々にご覧頂き、ありがとうございました! 120名の会場でしたが、ほぼ満員でした。 ライブ動画中継も、ニコニコ生放送で4392名、ustreamで181名の方々にご覧頂けたとのことです。 「歌声情報処理最前線!」の論文、スライド(講演資料)、動画へのリンクは、下記に順次掲載していきます。

(最終更新: 2010/08/23 22:00)

■ 論文、スライド(講演資料)、関連情報

  1. 大浦 圭一郎, 間瀬 絢美, 山田 知彦, 徳田 恵一, 後藤 真孝: "Sinsy: 「あの人に歌ってほしい」をかなえるHMM歌声合成システム"
    論文 | スライド | 関連Webページ
  2. 深山 覚, 西本 卓也, 嵯峨山 茂樹: "歌唱曲自動作曲の需要と今後 − 2年間のOrpheus運用を通じて"
    論文 | 関連Webページ
  3. 中野 倫靖, 後藤 真孝: "VocaListener2: ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システムの提案"
    論文 | スライド | 関連Webページ
  4. 後藤 真孝, 齋藤 毅, 中野 倫靖, 藤原 弘将: "歌声情報処理: 歌声を対象とした音楽情報処理"
    論文 | スライド
  5. 森勢 将雅,中野 皓太,西浦 敬信: "実時間歌唱力補正に基づく新たなカラオケエンタテインメントの創出"
    論文 | 関連Webページ
  6. 河原 英紀,森勢 将雅: "歌声を見て触る: TANDEM-STRAIGHTと時変モーフィングが提供する基盤"
    論文 | スライド | 関連Webページ | STRAIGHTのムービー
  7. 藤原 弘将, 後藤 真孝: "混合音中の歌声スペクトル包絡推定に基づく歌声の声質変換手法"
    論文 | 関連Webページ
  8. 阿曽 慎平, 齋藤 毅, 後藤 真孝, 糸山 克寿, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博: "SpeakBySinging: 歌声を話声に変換する話声合成システム"
    論文
  9. 大石 康智,亀岡 弘和,持橋 大地,永野 秀尚,柏野 邦夫 "Vocal Dynamics Controller: 歌声のF0動特性をノート単位で編集,合成できるインタフェース"
    論文 | スライド

■ 動画

■ イベント後の紹介記事(当日の模様の紹介等)

■ イベント前の紹介記事(事前案内等)

■ twitterハッシュタグ: #sigmus (SIGMUSは、音楽情報科学研究会の略称です)


[2010/07/26追記]
ニコニコ生放送でライブ中継されることが決まりました。 株式会社ニワンゴの「ニコニコ学術チャンネル」のご協力で、 こちらでご覧頂けます。

[2010/07/26追記]
ustreamでライブ中継されることが決まりました。 東京放送部のボンマツシマ様のご協力で、 こちらでご覧頂けます。

[2010/07/26追記]
7月28日(水)の昼食は、会場のつくばグランドホテルではとれず、 近辺に食堂はありますが、 送迎バスで到着後にセッション開始に間に合うように食事をするのは困難です。 また、会場周辺にコンビニエンスストアはないそうです。 下記でご案内した 秋葉原駅11:00発、つくば駅11:45着のつくばエクスプレスでは、 つくば駅付近で昼食を購入して、12時発の送迎バスに乗るのは困難ですので、 乗り遅れのないようにご注意頂きながら昼食をご計画下さい。 なお、つくば駅真上のつくばクレオスクエア(Q't)等には、 フードコートや飲食店、コンビニエンスストア等がありますので、 充分に早く到着すれば食事ができます。

[2010/07/26追記]
伊藤 博之 氏(クリプトン・フューチャー・メディア株式会社)戀塚 昭彦 氏(株式会社ドワンゴ)野尻 抱介 氏(SF作家) にも宿泊参加頂けることになりました! 20:00-22:00の討論セッション「歌声情報処理に乾杯!」にも フロアから参加頂ける予定です (ご本人の許諾を得て掲載していますが、急な予定変更の際には申し訳ありません)。

[2010/07/16追記]
研究会全体で、100名を超える多数の参加登録をありがとうございました。 まだ若干の追加が可能なので、 申し込み〆切を7月21日(水)まで延長 して、先着順で 参加登録・宿泊申込 を受け付けることになりました。 定員に達し次第、終了致しますので、 参加頂ける方はお早めにどうぞよろしくお願い致します。

[2010/07/08追記、07/13更新]
「VOCALOID」の生みの親の 剣持 秀紀 氏(ヤマハ株式会社)、 「初音ミク」の生みの親の 佐々木 渉 氏(クリプトン・フューチャー・メディア株式会社)に、 宿泊参加頂けることになりました! 20:00-22:00の討論セッション「歌声情報処理に乾杯!」にも参加頂ける予定です (ご本人の許諾を得て掲載していますが、急な予定変更の際には申し訳ありません)。 また、スペシャルセッション講演者は全員 (後藤 真孝、大浦 圭一郎、徳田 恵一、深山 覚、中野 倫靖、森勢 将雅、河原 英紀、藤原 弘将、阿曽 慎平、大石 康智(敬称略))、 討論セッション参加が確定しています。 討論セッションの形式・内容は、現在検討中です。

[2010/07/05追記]
参加ご希望の方は、事前登録が必要ですので、 事前申込受付 の「参加登録・宿泊申込システム」 から、ご登録頂けるでしょうか。 申し込み〆切は7月15日(木)です。 本セッションのみの日帰り参加も可能ですが、もし可能でしたら講演者と遅くまで議論・懇親できる宿泊参加がお勧めです。 なお、本研究会では通常、情報処理学会に所属していない方々にも多数ご参加頂いていますので、 お気軽にいらして下さい。

[2010/07/05追記]
報道関係の方々へ:
お席を確保するために、 事前に sigmus201007 [at] qwik.itri.aist.go.jp 宛に メディア名、人数、お名前をご連絡頂ければ幸いです。

情報処理学会 音楽情報科学研究会(夏シンポ2010)
イベント企画

夏シンポ2010全体(7月28〜30日)のプログラムはこちら

スペシャルセッション「歌声情報処理最前線!」

2010年7月28日(水)13:25-18:00 [つくばグランドホテル (定員120名)]
送迎バス申込者は秋葉原駅11:00発、つくバス利用者は秋葉原駅10:30発の
つくばエクスプレスに乗車すると、セッション開始に間に合います。

聴講参加費: 有料 (500〜3000円) (事前申込受付)
本セッションのみの日帰り参加も可能ですが、もし可能でしたら宿泊参加(初日1泊のみも可)がお勧めです。
  [全体概要]
 近年、歌声に関する研究活動が世界的に活発に取り組まれ、 学術的な観点からだけでなく、産業応用的な観点からも注目を集めています。 日本では2007年以来、 VOCALOID「初音ミク」に代表される歌声合成ソフトウェアがヒットし、 歌声合成技術に基づく楽曲がニコニコ動画に大量に投稿されて、 大規模な協調的創造活動が起きました。 その結果、 世界に類を見ない CGMの新たな時代を切り拓くと共に、 VOCALOID関連のCDは、商業音楽ヒットチャート「オリコン」のアルバム週間ランキングで1位を獲得するに至っています。 個人レベルで作成した歌声合成関連ソフトウェア (例えば、 MikuMikuDanceUTAU) も広まりつつあります。 こうした歌声合成以外にも、 既に商業音楽では、歌声の高さを信号処理で補正する技術が広く用いられており、 それを意図的に使った音楽(例えば、Perfume や T-Pain の近年の楽曲)は国内外で社会に定着しています。 他にも、歌声の自動分析に基づいたカラオケでの歌声採点機能等は広く普及しています。
 このように製品レベルや個人レベルでの技術開発の進歩と普及には目覚ましいものがありますが、 研究コミュニティでも様々な成果が生まれています。 そこで今回、 こうした 「歌声情報処理」 と名付けられた幅広いテーマを扱う研究分野の、最新の学術成果を一望できるスペシャルセッションを企画しました。
 第1部ではまず、 誰でも試せるWebサイトとして話題になった 歌声合成システム 「Sinsy」 (Web上で楽譜をアップロードすると歌声合成)と、 歌唱曲自動作曲システム 「Orpheus」 (Web上で歌詞を入力すると「歌」を自動作曲) の講演があります。 そして、 ニコニコ動画上でその動画が総計67万回再生された 「VocaListener(ぼかりす)」 (ユーザの歌い方を真似て歌声合成) に関して、 新たに声色(こわいろ)変化に対応した「VocaListener2(ぼかりす2)」の講演があります。
 次に第2部では、 「歌声情報処理」という研究分野の重要性と、 産業技術総合研究所で開発された九つの歌声情報処理システムを紹介する講演があります。 そして、 他の人の歌い方を入力歌唱に実時間で転写することにより、 歌が苦手でも簡単に歌えるカラオケシステムや、 様々な歌声情報処理システムの基盤技術となっている 「STRAIGHT」 とそのモーフィングへの応用を紹介する講演があります。
 最後に第3部では、 楽曲中の歌声と伴奏音の成分をそれぞれ高精度に推定することで、 混合音中の歌声の声質を他の人に変換できる手法や、 歌声を話声に自動変換するシステム「SpeakBySinging」に関する講演があります。 そして最後に、 歌声の高さが変化する際の動特性(ビブラートやオーバーシュートなど)を編集し、 合成できるインタフェース「Vocal Dynamics Controller」に関する講演があります。
 是非この機会に、普段、学会発表をご覧頂く機会が少ない方々にも、 学術研究の面白さとすごさを知って頂き、歌声情報処理分野の進歩を感じて頂ければと願っています。 皆様のご来場をお待ちしています。
 
13:25-13:35 スペシャルセッション「歌声情報処理最前線!」について
 
  オーガナイザー: 後藤 真孝(産業技術総合研究所)
1998年早稲田大学大学院理工学研究科博士後期課程修了。博士(工学)。 同年、電子技術総合研究所に入所し、2001年に改組された産業技術総合研究所において、現在、情報技術研究部門メディアインタラクション研究グループ長。 統計数理研究所 客員教授、筑波大学大学院 准教授(連携大学院)、IPA 未踏ユースPMを兼任。 ドコモ・モバイル・サイエンス賞 基礎科学部門 優秀賞、科学技術分野の文部科学大臣表彰 若手科学者賞、情報処理学会 長尾真記念特別賞等、25件受賞。 歌声を対象とした音楽情報処理を「歌声情報処理」と名付け、同分野のさらなる発展を目指して研究を幅広く展開中。
 
13:35-14:50 スペシャルセッション「歌声情報処理最前線!」第1部
          座長:後藤 真孝(産総研)
 
  (1) Sinsy: 「あの人に歌ってほしい」をかなえるHMM歌声合成システム
○大浦 圭一郎, 間瀬 絢美, 山田 知彦, 徳田 恵一(名古屋工業大学), 後藤 真孝(産業技術総合研究所)
  大浦 圭一郎(名古屋工業大学)
2010年名古屋工業大学大学院工学研究科情報工学専攻博士後期課程修了。 博士(工学)。 ATR音声言語コミュニケーション研究所有期補助員、 FP7 EMIMEプロジェクト研究員を経て、現在、名古屋工業大学特認助教、 総務省SCOPE研究員、株式会社テクノスピーチ代表取締役を兼任。 音声認識・合成に関する研究に従事し、 より自然な音声の再現を目指して研究を進めている。 現在、HMMに基づく歌声合成とインターフェース設計に対して、様々な研究課題に取り組んでいる。 「Sinsy」のメイン開発者。
 
  (2) 歌唱曲自動作曲の需要と今後 − 2年間のOrpheus運用を通じて
○深山 覚, 西本 卓也, 嵯峨山 茂樹(東京大学)
  深山 覚(東京大学)
平成22年 東京大学大学院 情報理工学系研究科 修士課程修了。現在、同研究科博士課程に在籍中。 平成20年度 情報処理学会 音楽情報科学研究会 「夏のシンポジウム」ベストプレゼンテーション賞、 平成21年度 情報処理学会 山下記念研究賞を受賞。 確率統計的アプローチによるメロディ・和声・リズムの分析と自動生成の研究に取り組んでいる。 作曲やアナリーゼなどを情報処理として実行できる、音楽を理解する計算機の実現を目標としている。
 
  (3) VocaListener2: ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システムの提案
○中野 倫靖, 後藤 真孝(産総研)
  中野 倫靖(産業技術総合研究所)
2008年筑波大学大学院図書館情報メディア研究科博士後期課程修了。博士(情報学)。 同年、産業技術総合研究所に特別研究員として入所し、現在、産業技術総合研究所研究員。 平成21年度 情報処理学会 山下記念研究賞 等、3件受賞。 計算機による歌声の分析と合成、それに基づくインタフェース構築に関する研究に取り組んでいる。 今後は、歌声をはじめ、音楽・音声・動画などのメディアコンテンツを対象に、 新しい楽しみ方を提供できる先進的な技術開発とその実用化による社会への貢献を目指す。
 
15:10-16:25 スペシャルセッション「歌声情報処理最前線!」第2部
          座長:伊藤 彰則(東北大学)
 
  (4) 歌声情報処理: 歌声を対象とした音楽情報処理
○後藤 真孝, 齋藤 毅, 中野 倫靖, 藤原 弘将(産業技術総合研究所)
  後藤 真孝(産業技術総合研究所)
1998年早稲田大学大学院理工学研究科博士後期課程修了。博士(工学)。 同年、電子技術総合研究所に入所し、2001年に改組された産業技術総合研究所において、現在、情報技術研究部門メディアインタラクション研究グループ長。 統計数理研究所 客員教授、筑波大学大学院 准教授(連携大学院)、IPA 未踏ユースPMを兼任。 ドコモ・モバイル・サイエンス賞 基礎科学部門 優秀賞、科学技術分野の文部科学大臣表彰 若手科学者賞、情報処理学会 長尾真記念特別賞等、25件受賞。 歌声を対象とした音楽情報処理を「歌声情報処理」と名付け、同分野のさらなる発展を目指して研究を幅広く展開中。
 
  (5) 実時間歌唱力補正に基づく新たなカラオケエンタテインメントの創出
○森勢 将雅, 中野 皓太, 西浦 敬信(立命館大学)
  森勢 将雅(立命館大学)
平16 和歌山大・システム工・デザイン情報卒。 平18 同大大学院システム研究科博士前期課程了。 同年4月より日本学術振興会特別研究員(DC1)。 平20 同大大学院博士後期課程了。 同年4月より関西学院大・理工・博士研究員。 平21 立命館大・情報理工・助教、現在に至る。博士(工学)。 音声・音響信号処理、インタフェース設計および聴覚情報処理の研究に従事。 平18 電気通信普及財団賞。電子情報通信学会、日本音響学会、情報処理学会、 日本バーチャルリアリティ学会、各会員。
 
  (6) 歌声を見て触る: TANDEM-STRAIGHTと時変モーフィングが提供する基盤
◯河原 英紀(和歌山大学), 森勢 将雅(立命館大学)
  河原 英紀(和歌山大学)
1977年北海道大学大学院工学研究科博士課程修了。工学博士。 NTT基礎研究所、ATR人間情報通信研究所等を経て、1997年より和歌山大学システム工学部教授。聴覚メディア処理、音声分析合成、音響・音声知覚の研究に従事。1997-2002まで科学技術振興機構CREST聴覚脳プロジェクト研究代表者。CrestMuseプロジェクトでは、人間の歌声の豊かさ美しさを理解し自在に操作できる技術の開発を担当。
 
16:45-18:00 スペシャルセッション「歌声情報処理最前線!」第3部
          座長:中野 倫靖(産業技術総合研究所)
 
  (7) 混合音中の歌声スペクトル包絡推定に基づく歌声の声質変換手法
○藤原 弘将, 後藤 真孝(産業技術総合研究所)
  藤原 弘将(産業技術総合研究所)
2007年京都大学大学院情報学研究科知能情報学専攻修士課程修了。 同年、産業技術総合研究所に研究員として入所し、現在に至る。 2010年京都大学大学院情報学研究科知能情報学専攻博士課程修了。 博士(情報学)。 情報処理学会山下記念研究賞受賞。 音楽音響信号理解研究に従事し、計算機による歌声の認識と音楽情報検索、 音楽鑑賞支援インタフェースへの応用に取り組んできた。
 
  (8) SpeakBySinging: 歌声を話声に変換する話声合成システム
○阿曽 慎平(京都大学), 齋藤 毅, 後藤 真孝(産業技術総合研究所), 糸山 克寿, 高橋 徹, 駒谷 和範, 尾形 哲也, 奥乃 博(京都大学)
  阿曽 慎平(京都大学)
2010年京都大学工学部卒業。同年、京都大学大学院情報学研究科修士課程入学。 人々を魅了する歌声に強い興味を持ち、音声研究の傍ら歌手としても活動。 歌声と話声の音響的な違いを分析するため、 また魅力的な音声合成を実現するために 歌声を話声に変換する話声合成システム「SpeakBySinging」を 齋藤毅、後藤真孝らと共に研究。
 
  (9) Vocal Dynamics Controller: 歌声のF0動特性を音高単位で編集し、合成できるインタフェース
○大石 康智, 亀岡 弘和, 持橋 大地, 永野 秀尚, 柏野 邦夫(NTTコミュニケーション科学基礎研究所)
  大石 康智(NTTコミュニケーション科学基礎研究所)
2009年名古屋大学大学院情報科学研究科博士後期課程修了。博士(情報科学)。同年、日本電信電話株式会社に入社し、現在、NTTコミュニケーション科学基礎研究所研究員。平成20年度情報処理学会 山下記念研究賞等、3件受賞。歌声をはじめ、人の声に含まれる非言語情報(意図やスタイル、感情や個性など)のモデリングに関する基礎研究に取り組み、将来は、人の気持ちを理解するコンピュータの実現を目指す。
 
 

 
参考: Back to: