情報処理学会 音楽情報科学研究会・音声言語情報処理研究会 イベント企画
スペシャルセッション「歌声情報処理最前線!!」
2012年2月3日(金)午後 ホテルウェルシーズン浜名湖(静岡県浜松市)

多くの方々にご覧頂き、どうもありがとうございました!

2012/02/03〜04に開催された「歌声情報処理最前線!!」を多くの方々にご覧頂き、ありがとうございました! 「歌声情報処理最前線!!」の論文、スライド(講演資料)、動画へのリンクは、下記に順次掲載していきます。

■ ライブ動画中継

■ 論文、スライド(講演資料)、関連情報

  1. 徳田 恵一, 大浦 圭一郎(名工大): "[依頼講演] 自動学習により人間のように歌う音声合成システム ---Sinsy---"
    論文 | スライド | 関連Webページ
  2. 大道 竜之介(東北大), 伊藤 仁(東北工業大), 牧野 正三(東北文化学園大), 伊藤 彰則(東北大): "アマチュア歌唱エンタテインメントのための熱唱度評価システムSEES"
    論文 | スライド
  3. 村主 大輔, 馬場 隆(関西学院大), 森勢 将雅(立命館大), 片寄 晴弘(関西学院大): "奄美大島民謡風歌声合成システム: グインレゾネータ"
    論文 | スライド | 関連Webページ
  4. 剣持 秀紀(ヤマハ): "[依頼講演] 歌声合成ソフトウェアVOCALOID3とVOCALOID Job Plugin"
    論文 | スライド | 関連Webページ
  5. rankingloid(ニコニコランキング動画制作組合): "[依頼講演] 日刊VOCALOIDランキング: ランキング動画全自動生成システムとその運用"
    論文 | スライド | 関連Webページ
  6. 中野 倫靖, 後藤 真孝, 梶田 秀司, 松坂 要佐, 中岡 慎一郎, 横井 一仁(産総研): "[依頼講演] VocaWatcher: 人間の歌唱時の表情を真似るヒューマノイドロボットの顔動作生成システム"
    論文 | スライド | 関連Webページ
  7. 才野 慶二郎(ヤマハ), 大浦 圭一郎(名工大), 橘 誠, 剣持 秀紀(ヤマハ), 徳田 恵一(名工大): "ラップスタイル歌声合成の検討"
    論文 | スライド
  8. 河原 英紀(和歌山大): "[依頼講演] 歌声のテクスチャに信号処理はどう迫るか"
    論文 | スライド (メディア, iBook版) | 関連Webページ
  9. 森勢 将雅(立命館大), 河原 英紀(和歌山大), 小川 真(電通大): "協調的創造活動支援を目的とした歌声合成基盤技術の研究開発"
    論文 | スライド | 関連Webページ
  10. 小川 真, 矢崎 俊志, 阿部 公輝(電通大): "v.Connect:ユーザが声色操作を指定できる歌声合成器"
    論文 | スライド | 関連Webページ
  11. 大石 康智(NTT), 亀岡 弘和(東大/NTT), 持橋 大地(統数研), 柏野 邦夫(NTT): "歌唱における意図表現を考慮した歌声F0生成過程とその統計的モデリング"
    論文 | スライド (ビデオ)
  12. 辰巳 直也, 馬場 隆(関西学院大), 森勢 将雅(立命館大), 片寄 晴弘(関西学院大): "ロックボーカルレゾネータ: Vocaloid歌唱をロックボーカリスト風の歌い方に変換するシステム"
    論文 | スライド | 関連Webページ
  13. 阿曽 慎平(京大), 齋藤 毅(金沢大), 後藤 真孝(産総研), 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博(京大): "スペクトル変化量のピーク間隔・F0・MFCCを用いた歌声と朗読音声の自動識別システム"
    論文 | スライド (補足)
  14. 加藤 圭造, 伊藤 彰則(東北大): "グロウル及びスクリーム歌唱の合成に向けた音響的特徴の分析"
    論文 | スライド
  15. 大浦 圭一郎,間瀬 絢美,南角 吉彦,徳田 恵一(名工大): "HMM歌声合成における音高正規化学習の検討"
    論文 | スライド | 関連Webページ

■ イベント後の紹介記事(当日の模様の紹介等)

■ イベント前の紹介記事(事前案内等)

(最終更新: 2012/02/10 09:00)

■ twitterハッシュタグ: #sigmus (SIGMUSは、音楽情報科学研究会の略称です)


[2012/01/31追記]
当日ご参加頂く皆様へ別途メールでご案内しています通り、参加者間の交流促進・議論の活性化のために、是非ポジションペーパー名札 (記入用ppt | 記入用pdf | 見本pdf, 片面: 幅108mm×高さ145mm以内) を両面分作成・印刷してご持参下さい。 テンプレートは切りぬいて二つ折りを想定しており、受付で透明の首下げ名札入れをお渡しします。 本名でなくペンネームやP名等でも構いません。 このポジションペーパー名札は、 国内査読付き会議 WISS 2010WISS 2011 (会議名のリンク先が名札説明) で初めて導入され、有効性が確認されました。

[2012/01/31追記]
ニコニコ生放送でライブ動画中継されることが決まりました。 株式会社ドワンゴの「ニコニコ学術チャンネル」のご協力で、 2/3(金) 13:00-18:002/4(土) 09:00-10:40 でご覧頂けます。

[2012/01/31追記]
ustreamでライブ動画中継されることが決まりました。 2/3(金) 13:00-18:002/4(土) 09:00-10:40 でご覧頂けます。 twitterハッシュタグ #sigmus もご活用下さい。

[2012/01/18追記]
多数の参加登録をありがとうございました。 登録が増え続けているため、事前参加登録を1月20日(金)まで延長していますが、もしそれ以上遅れてしまう場合には個別にご相談下さい。

[2012/01/12追記]
最初のセッションから発表が1件減ったため、プログラムが変更になりました(休憩が長く、終了が10分早くなりました)。

[2011/12/14追記]
参加ご希望の方は事前登録が必要ですので、 研究会全体(2月3〜4日)のご案内をご覧の上、 参加申込フォーム から、ご登録頂けるでしょうか。 申し込み〆切は2012年1月15日(日)です(定員になり次第、早期に終了する可能性があります。また、無料送迎バスの定員が限られています)。 本セッションのみの日帰り参加も可能ですが、もし可能でしたら講演者と遅くまで議論・懇親できる宿泊参加がお勧めです。 なお、本研究会では通常、情報処理学会に所属していない方々にも多数ご参加頂いていますので、 お気軽にいらして下さい。

[2011/12/14追記]
伊藤 博之 氏(クリプトン・フューチャー・メディア株式会社)剣持 秀紀 氏(ヤマハ株式会社)戀塚 昭彦 氏(株式会社ドワンゴ)野尻 抱介 氏(SF作家) (五十音順)に宿泊参加頂けることになりました。 20:30-22:00の討論セッション「未来の音楽情報処理・音声言語情報処理技術への期待」で パネリストとして一人10分程度のご発言の後、フロアを交えて議論頂く予定です (ご本人の許諾を得て掲載していますが、急な予定変更の際には申し訳ありません)。
[2011/12/22追記]
残念ながら濱野 智史 氏から参加が難しくなったというご連絡を頂きました。

[2011/12/14追記]
rankingloid 氏(ニコニコランキング動画制作組合)による 依頼講演 「日刊VOCALOIDランキング: ランキング動画全自動生成システムとその運用」が 追加になりました。

報道関係の方々へ:
お席を確保するために、 事前に sigmus201202 [at] sigmus.jp 宛に メディア名、人数、お名前をご連絡頂ければ幸いです。

聴講参加の方々へ:
12月末〜1月頭頃に事前参加登録を開始予定です。本企画案内ページ、 @ipsj_sigmushttp://www.sigmus.jp/http://sig-slp.jp/音楽情報科学メーリングリスト(MACS) 等でご案内します。

事前参加登録 を開始しました。

研究者の方々へ:
本スペシャルセッションでの一般講演(原稿6ページ、発表時間20〜25分(質疑込み、件数により調整)) を募集しています。 第94回研究発表会:発表募集 からご応募頂けるでしょうか。 発表申し込み〆切は2011年12月2日(金)です。 ただし、申し込み件数が多い場合には、2月4日の通常セッションでの発表となる可能性があります。 申し訳ありませんが事前にご了承頂きたく、どうぞよろしくお願い致します。

多数の申し込み、ありがとうございました。 一部、2月4日朝のセッションとなり、申し訳ありませんでした。

情報処理学会 音楽情報科学研究会・音声言語情報処理研究会
イベント企画

研究会全体(2月3〜4日)のご案内はこちら

スペシャルセッション「歌声情報処理最前線!!」

2012年2月3日(金)13:00-18:10 [ホテルウェルシーズン浜名湖(静岡県浜松市)]
送迎バス申込者は浜松駅11:40発に乗車すると、セッション開始に間に合います。
午前のヤマハ工場見学会もお勧めです(見学申込者は浜松駅09:10発の見学専用バスに乗車)。

聴講参加費: 有料 (500〜3000円) (事前参加登録が必要です)
本セッションのみの日帰り参加も可能ですが、もし可能でしたら翌日までの宿泊参加(2月3〜4日)がお勧めです。
  [全体概要]
 2010年7月に開催された第一回目の スペシャルセッション「歌声情報処理最前線!」に引き続き、 今回、第二回目のスペシャルセッション「歌声情報処理最前線!!」を企画しました。
 近年、歌声に関する研究活動が世界的に活発に取り組まれ、 学術的な観点からだけでなく、産業応用的な観点からも注目を集めています。 日本では2007年以来、 VOCALOID「初音ミク」に代表される歌声合成ソフトウェアが注目を集め、 歌声合成技術に基づく楽曲がニコニコ動画に大量に投稿されて、 大規模な協調的創造活動が起き続けています。 その結果、世界に類を見ない CGMの新たな時代を切り拓くと共に、 VOCALOID関連のCDは、商業音楽ヒットチャート「オリコン」のアルバム週間ランキングで1位を獲得するに至っています。 「初音ミク」のライブコンサートは日本国内だけでなく、アメリカ動画)やシンガポールでも開催され、 多くの人々を魅了しました。 「人間の歌声でなければ聴く価値がない」という旧来の価値観を打破し、 合成された歌声がメインボーカルの楽曲を多くの人々が積極的に楽しむ文化が成立することが、 世界で初めて実証されたわけです。
 それには、VOCALOID技術を生み出したヤマハ株式会社の貢献はもちろん大きいですが、 キャラクタという身体性を合成歌声に持たせたことで 「誰が歌っているのか」「誰に歌わせたいのか」を明確にした クリプトン・フューチャー・メディア株式会社の貢献も本質的で不可欠でした。 さらに、時刻同期コメントによって、視聴者の移り変わる感情を クリエータに伝えることができる「ニコニコ動画」という社会装置も重要な役割を果たしています。 クリエータ、リスナ、歌声音源提供者、サポートする方々の活躍も欠かせません。 MikuMikuDance等の個人レベルで作成した様々な歌声合成関連ソフトウェアの利用も広がっています。
 こうした歌声合成以外にも、 既に商業音楽では、歌声の高さを信号処理で補正する技術が広く用いられており、 それを意図的に使った音楽は国内外で社会に定着しています。 他にも、歌声の自動分析に基づいたカラオケでの歌声採点機能等は広く普及しています。
 このように製品レベルや個人レベルでの技術開発の進歩と普及には目覚ましいものがありますが、 研究コミュニティでも 「歌声情報処理」 は注目を集め、様々な成果が生まれています。 そこで今回は第二回目の企画として、 5件の依頼講演に加えて一般講演も募集し、 最新の学術成果を一望できるスペシャルセッションを開催致します。
 是非この機会に、普段、学会発表をご覧頂く機会が少ない方々にも、 学術研究の面白さとすごさを知って頂き、歌声情報処理分野の進歩を感じて頂ければと願っています。 皆様のご来場をお待ちしています。
 
13:00-13:15 スペシャルセッション「歌声情報処理最前線!!」について
          オーガナイザー:後藤 真孝(産総研)
 
13:15-14:20 スペシャルセッション「歌声情報処理最前線!!」第1部 (依頼講演25分x1 + 一般講演20分x2)
          座長:中野 倫靖(産総研)
 
  (1) [依頼講演] 自動学習により人間のように歌う音声合成システム ---Sinsy---
    徳田 恵一, 大浦 圭一郎(名工大)
  (2) アマチュア歌唱エンタテインメントのための熱唱度評価システムSEES
    大道 竜之介(東北大), 伊藤 仁(東北工業大), 牧野 正三(東北文化学園大), 伊藤 彰則(東北大)
  (3) 奄美大島民謡風歌声合成システム: グインレゾネータ
    村主 大輔, 馬場 隆(関西学院大), 森勢 将雅(立命館大), 片寄 晴弘(関西学院大)
 
14:40-16:15 スペシャルセッション「歌声情報処理最前線!!」第2部 (依頼講演25分x3 + 一般講演20分x1)
          座長:伊藤 彰則(東北大学)
 
  (4) [依頼講演] 歌声合成ソフトウェアVOCALOID3とVOCALOID Job Plugin
    剣持 秀紀(ヤマハ)
  (5) [依頼講演] 日刊VOCALOIDランキング: ランキング動画全自動生成システムとその運用
    rankingloid(ニコニコランキング動画制作組合)
  (6) [依頼講演] VocaWatcher: 人間の歌唱時の表情を真似るヒューマノイドロボットの顔動作生成システム
    中野 倫靖, 後藤 真孝, 梶田 秀司, 松坂 要佐, 中岡 慎一郎, 横井 一仁(産総研)
  (7) ラップスタイル歌声合成の検討
    才野 慶二郎(ヤマハ), 大浦 圭一郎(名工大), 橘 誠, 剣持 秀紀(ヤマハ), 徳田 恵一(名工大)
 
16:35-18:00 スペシャルセッション「歌声情報処理最前線!!」第3部 (依頼講演25分x1 + 一般講演20分x3)
          座長:後藤 真孝(産総研)
 
  (8) [依頼講演] 歌声のテクスチャに信号処理はどう迫るか
    河原 英紀(和歌山大)
  (9) 協調的創造活動支援を目的とした歌声合成基盤技術の研究開発
    森勢 将雅(立命館大), 河原 英紀(和歌山大), 小川 真(電通大)
  (10) v.Connect:ユーザが声色操作を指定できる歌声合成器
    小川 真, 矢崎 俊志, 阿部 公輝(電通大)
  (11) 歌唱における意図表現を考慮した歌声F0生成過程とその統計的モデリング
    大石 康智(NTT), 亀岡 弘和(東大/NTT), 持橋 大地(統数研), 柏野 邦夫(NTT)
 
20:30-22:00 討論セッション「未来の音楽情報処理・音声言語情報処理技術への期待」
          オーガナイザー:後藤 真孝(産総研)
 
  パネリスト(五十音順):
    伊藤 博之(クリプトン・フューチャー・メディア株式会社)  [初音ミク、ピアプロの生みの親]
    剣持 秀紀(ヤマハ株式会社)  [VOCALOIDの生みの親]
    戀塚 昭彦(株式会社ドワンゴ)  [ニコニコ動画の生みの親]
    野尻 抱介(SF作家)  [ピアピア動画の生みの親]
 
スペシャルセッション「歌声情報処理最前線!!」 依頼講演 (講演順)
 
  自動学習により人間のように歌う音声合成システム ---Sinsy---
徳田 恵一, 大浦 圭一郎(名古屋工業大学)
  徳田 恵一(名古屋工業大学)
1984年、名古屋工業大学電気電子工学科卒業。1989年、東京工業大学大学院総合理工学研究科博士後期課程修了。工学博士。現在、名古屋工業大学大学院工学研究科教授。 2001〜2002年、カーネギーメロン大学言語技術研究所客員研究員。名古屋工業大学のプロジェクト研究所である国際音声技術研究所の代表。 人間のように話すことのできる新しい音声合成方式「HMM音声合成」の開発をリードしてきた。 音声言語情報処理、統計的機械学習理論の研究に従事。 現在、音声技術の普及にブレークスルーをもたらす方法論について模索中。
 
  歌声合成ソフトウェアVOCALOID3とVOCALOID Job Plugin
剣持 秀紀(ヤマハ株式会社)
  剣持 秀紀(ヤマハ株式会社)
ヤマハ株式会社 yamaha+推進室Y2プロジェクト 開発担当主管技師。1993年京都大学大学院工学研究科修士課程修了、ヤマハ株式会社入社。1996年エル・アンド・エイチジャパン株式会社出向。1999年 ヤマハ株式会社復職。以降VOCALOIDを含む音声・歌声信号処理に関する研究開発に従事。趣味はヴァイオリンおよびヴィオラの演奏、アナログレコード鑑賞、ベルギービール研究。
 
  日刊VOCALOIDランキング: ランキング動画全自動生成システムとその運用
rankingloid(ニコニコランキング動画制作組合)
  rankingloid(ニコニコランキング動画制作組合)
ニコニコ動画内のコミュニティであるニコニコランキング動画制作組合所属。2008年2月、ニコニコ動画にて、その日よく観られたVOCALOID関連の動画をランキング形式で紹介する動画「日刊VOCALOIDランキング」を、プログラムによって自動生成、公開。2011年8月まで毎日作成し続けた。他のランキング動画作者に制作支援ツールも提供。現在はランキング動画以外にも使える、より汎用的な定型的動画の生成ツールや、動画編集の敷居を一段下げるような動画処理ソフトウェア等を開発している。
 
  VocaWatcher: 人間の歌唱時の表情を真似るヒューマノイドロボットの顔動作生成システム
中野 倫靖, 後藤 真孝, 梶田 秀司, 松坂 要佐, 中岡 慎一郎, 横井 一仁(産業技術総合研究所)
  中野 倫靖(産業技術総合研究所)
2008年筑波大学大学院図書館情報メディア研究科博士後期課程修了。博士(情報学)。 同年、産業技術総合研究所に特別研究員として所属し、現在、産業技術総合研究所研究員。 平成21年度 情報処理学会 山下記念研究賞 等、3件受賞。 計算機による歌声の分析と合成、それに基づくインタフェース構築に関する研究に取り組んでいる。 今後は、歌声をはじめ、音楽・音声・動画などのメディアコンテンツを対象に、 新しい楽しみ方を提供できる先進的な技術開発とその実用化による社会への貢献を目指す。
 
  歌声のテクスチャに信号処理はどう迫るか
河原 英紀(和歌山大学)
  河原 英紀(和歌山大学)
1977年北海道大学大学院工学研究科博士課程修了。工学博士。 NTT基礎研究所、ATR人間情報通信研究所等を経て、1997年より和歌山大学システム工学部教授。1997〜2002年、科学技術振興機構CREST聴覚脳プロジェクト研究代表者。人間の聴覚情報表現に基いた音声・音響情報処理技術を追求。音声分析変換合成法STRAIGHTと音声モーフィングツールなどの研究開発と普及を通じて、音声や歌声の生成と知覚の研究におけるパラダイムシフトを画策している。
 
スペシャルセッション「歌声情報処理最前線!!」 オーガナイザー
 
  後藤 真孝(産業技術総合研究所)
1998年早稲田大学大学院理工学研究科博士後期課程修了。博士(工学)。 同年、電子技術総合研究所に入所し、2001年に改組された産業技術総合研究所において、 現在、情報技術研究部門 上席研究員 兼 メディアインタラクション研究グループ長。 統計数理研究所 客員教授、筑波大学大学院 准教授(連携大学院)、IPA未踏IT人材発掘・育成事業PMを兼任。 ドコモ・モバイル・サイエンス賞 基礎科学部門 優秀賞、科学技術分野の文部科学大臣表彰 若手科学者賞、情報処理学会 長尾真記念特別賞等、27件受賞。 歌声を対象とした音楽情報処理を「歌声情報処理」と名付け、同分野のさらなる発展を目指して研究を幅広く展開中。
 

2012年2月4日(土)の通常セッションにも、下記の歌声情報処理関連の一般講演がありますので、是非ご覧下さい。

09:00-10:40 通常セッション「歌声情報処理」 (一般講演25分x4)
(12) ロックボーカルレゾネータ: Vocaloid歌唱をロックボーカリスト風の歌い方に変換するシステム
    辰巳 直也, 馬場 隆(関西学院大), 森勢 将雅(立命館大), 片寄 晴弘(関西学院大)
(13) スペクトル変化量のピーク間隔・F0・MFCCを用いた歌声と朗読音声の自動識別システム
    阿曽 慎平(京大), 齋藤 毅(金沢大), 後藤 真孝(産総研), 糸山 克寿, 高橋 徹, 尾形 哲也, 奥乃 博(京大)
(14) グロウル及びスクリーム歌唱の合成に向けた音響的特徴の分析
    加藤 圭造, 伊藤 彰則(東北大)
(15) HMM歌声合成における音高正規化学習の検討
    大浦 圭一郎,間瀬 絢美,南角 吉彦,徳田 恵一(名工大)


 
参考: Back to: