[ English | Japanese（日本語） ]

VocaListener（ボーカリスナー）で歌うサイバネティックヒューマン HRP-4C 未夢（ミーム）

VocaWatcher (ぼかうお): ユーザの歌い方を真似ることが可能なロボットの顔表情合成システム

梶田秀司 ¹ ／中野倫靖 ² ／後藤真孝 ² ／松坂要佐 ³ ／中岡慎一郎 ¹ ／松本吉央 ⁴ ／横井一仁 ¹

¹ 産業技術総合研究所知能システム研究部門ヒューマノイド研究グループ
² 産業技術総合研究所情報技術研究部門メディアインタラクション研究グループ
³ 産業技術総合研究所知能システム研究部門インタラクションモデリング研究グループ
⁴ 産業技術総合研究所知能システム研究部門サービスロボティクス研究グループ

Email: vocawatcher [at] m.aist.go.jp
twitterアカウント: @VocaWatcher

デモンストレーション動画:　ニコニコ動画　 YouTube

初めて本ページをご覧になる方は、まずは上記の視聴をお勧めいたします。

デモ展示情報:

CEATEC JAPAN 2010（2010年10月5日～9日）
2010年10月5日(火)～9日(土) に CEATEC JAPAN 2010 (幕張メッセ) にて展示中です。
展示場所はホール５（電子部品・デバイス＆装置ステージ）5F55 の産業技術総合研究所のブースです。
- デモンストレーションをしている楽曲情報
  - 「PROLOGUE」 (RWC-MDB-P-2001 No.7)
    - お手本歌唱: サリヤ人様 (歌声と顔映像)
    - 歌声合成システム: 初音ミク (VOCALOID 2)
  - 「PROLOGUE 2010」 (編曲: 田中アマノ, 原曲: RWC-MDB-P-2001 No.7)
    - お手本歌唱: サリヤ人様 (歌声と顔映像)
    - 歌声合成システム: 初音ミク (VOCALOID 2)
  - 「Packaged」 (作詞・作曲・編曲: kz 様)
    - お手本歌唱: サリヤ人様 (歌声と顔映像)
    - 歌声合成システム: メグッポイド (VOCALOID 2)
  - 「逢路（おうろ）」 (作詞・作曲・編曲: ルシュカ様)
    - お手本歌唱: ルシュカ様 (歌声と顔映像)
    - 歌声合成システム: VY1 (VOCALOID 2)
産総研オープンラボ2010（2010年10月14日～15日）
2010年10月14日(木)～15日(金) に産総研オープンラボ2010 (産総研つくば) にて、
「I-71 VocaListenerで歌うサイバネティックヒューマンHRP-4C未夢」[第2A会場] を展示予定です。
見学の予約は10月7日(木)まで、こちらで受け付けています（I-71の「見学予約する」を押して下さい）。
ロボスクエア (2013年3月30日～31日)
HRP-4C未夢（ミーム）パフォーマンスショー

メディア報道、記事一覧:

THE WALL STREET JOURNAL: Japan's Next Pop Idol is a Robot? (2010/10/6)
THE WALL STREET JOURNAL: 未来の日本のアイドルはロボット？ (2010/10/6)
GIGAZINE: 人の声や表情をお手本により自然に歌えるようになった美少女ロボ「未夢」が初音ミクの声で歌うムービー (2010/10/6)
ITmedia News: CEATEC JAPAN 2010：美少女ロボ「HRP-4C未夢」と「ぼかりす」を結ぶ産総研内コラボ「ぼかうお」とは？ (2010/10/6)
- [Yahoo! ニュース]
マイコミジャーナル: CEATEC JAPAN 2010 - 今年のHRP-4Cは歌って踊る! セイコちゃんもすごいぞ (2010/10/7)
ロボコンマガジン: CEATEC2010に行ってきました (2010/10/7)
MSN産経ニュース: 【シーテックみどころ】「歌うロボ」登場　産総研 (2010/10/7)
- [SankeiBiz]
- [Yahoo! ニュース]
時事通信: 人型ロボットが人気＝実用性重視の米社も－シーテック (2010/10/7)
- [ウォールストリートジャーナル日本版]
- [朝日新聞]
- [Yahoo!ニュース]
産経新聞8面（全国版）: "人間離れ技術に喝采"(2010/10/8)
産経新聞（大阪版）: "歌手顔負け"(2010/10/8)
BBC News: Singing androids and robot teddies at Ceatec (2010/10/08)
BBC One: "Breakfast" (2010/10/09 07:00 TV broadcast in UK)
BBC News: "Click" (the BBC's flagship technology programme) (2010/10/09 11:30, 2010/10/10 04:30, 11:30, 2010/10/11 00:30, 2010/10/14 03:30 / TV broadcast in UK)
BBC World News: "Click" (the BBC's flagship technology programme) (2010/10/09 and 10/10 / TV broadcast in over 200 countries)
robonable (ロボナブル): 産総研、人のように歌唱するヒューマノイド公開、歌声と表情の自動生成技術により実現 (2010/10/11)
DigInfo TV: より自然な歌唱が可能になった女性型ロボット HRP-4C (2010/10/12)
RBB TODAY: 自然な歌声と表情でうたう女性ロボット「HRP-4C」がデモ展示 (2010/10/12)
- [Infoseek ニュース]
- [BIGLOBE ニュース]
- [Yahoo! ニュース]
DigInfo TV: HRP-4C Humanoid Robot now sings even more naturally (2010/10/13)
Mail Online: Female robot learns to 'sing' by copying human singer (2010/10/14)
web R25: 人間型ロボット「未夢」ちゃん　初音ミクの声で歌公開 (2010/10/15)
Tech News Daily: Freaky! Fembot Sings, Mimicking Pop Stars (2010/10/15)
PhysOrg.com: Introducing Japan’s new singing robot (w/ Video) (2010/10/15)
Wired.com Underwire: Video: Tuneful Japanese Robot Mimics Real Singers (2010/10/16)
WIRED.jp Archives: 日本の歌う少女ロボ(動画) (2010/10/16)
ガジェット通信: 人間らしく歌い上げるロボット『HRP-4C未夢』の秘密は”無意識”だった (2010/10/20)
CifraNews（ロシア）(2010/10/20)
森山和道の「ヒトと機械の境界面」: YouTubeのアクセス解析からヒューマノイド・ロボット・コンテンツの可能性を探る (2010/10/29)
森山和道, CEATEC JAPAN 2010 "産総研製、VocaListenerで歌う HRP-4C 未夢", ロボコンマガジン, No.73, p.43, 2011.1. (2010/12/15 発行)
NHK教育サイエンスZERO: 「ヒット連発！！あのボーカルソフトの秘密」(2011/2/5)
- 2011年2月 5日(土) [教育] 午後10：00～午後10：35
- 2011年2月11日(金) [教育] 午後 6：55～午後 7：30
- 2011年2月12日(土) [BS2]　午前 3：25～午前 4：00
ITmedia ねとらぼ: 2011国際ロボット展：産総研の美少女ロボ・未夢が初音ミクの声で「PROLOGUE」を歌っていた (2011/11/1)
NHK総合ゆうどきネットワーク: ゆうどきライブ　「過去最大！最新ロボットが集結」 (2011/11/11)
RocketNews24: Singing Humanoid Robot Has Cute Plump Cheeks, Could Use a New Wardrobe ? (2011/11/12)
TBSテレビ王様のブランチ: 最新ロボットの豆知識 (2011/11/19)
日本放送協会(NHK) Science View 2012年3月11日(日) [NHK WORLD TV] 09:10-09:40（日本時間）
「Singing Synthesizers: The Technology Behind a Digital Popstar」(2012/3/11)
BSフジガリレオX: 表情の進化学　ロボットにどんな顔をもたせるか？ 12:30-13:00 (2015/4/26), 再放送 11:30-12:00 (2015/5/3)

初音ミクみく: 「HRP-4C未夢」が「ぼかりす」と「ぼかうお」を実装したデモがすごすぐる件 (2010/10/6)
[Z]ZAPAブロ～グ2.0: HRP-4C未夢がパワーアップしてた。一方VOCALOIDは… (2010/10/6)
藤本健の“DTMステーション”: CEATECにはボーカロイドがいっぱい！ (2010/10/6)
初音ミク視聴のススメ：「CEATEC JAPAN 2010」でのVOCALOID関連展示まとめ（雑記） (2010/10/8)
ルシュカの祭典: CEATEC JAPAN 2010 (2010/10/11)
LiveartGEEKS: 女性型ロボット「HRP-4C　未夢（ミーム）」、更なる進化。彼女はどのくらい人間に近づいているのか？(2010/10/14)

VocaListener で歌うサイバネティックヒューマン HRP-4C 未夢 [印刷用PDF]

研究のポイント:

サイバネティックヒューマン HRP-4C がより自然な歌声と表情で歌唱可能に
人の歌唱をお手本に自然な歌声を自動生成する技術VocaListener（ボーカリスナー, 略して「ぼかりす」）をロボットで初めて使用
人の歌唱をお手本にロボットの顔動作を自動生成する技術VocaWatcher（ボーカウォッチャー, 略して「ぼかうお」）を新規開発

研究のねらい:

ロボット技術のエンターテインメント産業への展開を図るために、時間のかかる割には人らしい自然さを実現することが難しかった、人間型ロボットの歌唱動作の高度化に挑戦しています。従来、ロボットに歌わせるには、(1) 歌声合成ソフトウェアに楽譜と歌詞を入力して調整を行う、(2) 人の動きと歌詞を参考に人手でロボットの動きを作成する、という作業が必要でした。本研究では、人の歌唱を録画したデータから、ロボットの歌声と表情を自動的に生成する技術を開発し、人の歌い方をお手本に真似て歌うシステムを実現しました。

サイバネティックヒューマンHRP-4C未夢

研究内容:

VocaListener は、録音された歌唱音声の事例からその歌い方（声の高さと大きさ）を真似た歌声を、市販の歌声合成ソフトウェアを用いて合成する技術です。この技術の枠組みを援用し、録画された歌唱時の顔の運動データから、サイバネティックヒューマンHRP-4Cの顔表情の動作パターンを自動生成する技術VocaWatcherを開発しました。具体的には、歌い手の顔の各部位の運動をもとに、それにできるだけ近い動きを作り出すロボットの制御コマンドを推定します。さらにVocaListenerによる歌声とVocaWatcherによる表情とが正確に同期するように制御することで、HRP-4Cが自然に歌唱できるようになりました。

歌声合成技術VocaListener

表情合成技術VocaWatcher

Demonstrations:

CEATEC JAPAN 2010での新規性は以下の三つです。

人の歌唱をお手本に自然な歌声を自動生成する技術VocaListenerをロボットで初めて使用
CEATEC JAPAN 2009のHRP-4Cのデモでは歌声合成はVOCALOID2のみでしたが、 CEATEC JAPAN 2010で初めて、VocaListenerをロボットの歌声合成に使用しました。
人の歌唱をお手本にロボットの顔動作を自動生成する技術VocaWatcherを新規開発（今回初公開）　
CEATEC JAPAN 2009のHRP-4Cのデモではロボットの顔動作は人手で作成したパターンによる制御が中心で、首から下は動作していませんでしたが、 CEATEC JAPAN 2010で初めて、お手本歌唱の顔画像処理によってロボットの顔動作を自動生成するVocaWatcherを紹介します。首から下も、手作業でパターンを作成した振り付けをします。
VocaListenerの追加機能としてブレス音の自動検出＆合成技術を新規開発（今回初公開）
VocaListenerの新機能としてブレス音の自動検出と合成を実現しました。 VocaWatcherによってお手本の顔動作を真似ると、ブレス（息継ぎ）のときに、音がないのに口を開けて違和感のある場面が多々ありました。そこで、お手本の歌声を分析してブレス音を自動検出し、その箇所に適切に合成することで、そうした違和感が減りました。

本研究のデモンストレーション動画を、

【初音ミク】 VocaListenerで歌うHRP-4C未夢【ぼかりす＋ぼかうお】 :ニコニコ動画（2010年10月5日）
【初音ミク】 VocaListenerで歌うHRP-4C未夢【ぼかりす＋ぼかうお】 :YouTube（2010年10月14日）

に掲載させて頂きました。

VocaWatcher Demo

VocaWatcher デモ (使用楽曲: RWC-MDB-P-2001 No.7「PROLOGUE」、合成音源「初音ミク」、お手本歌唱「サリヤ人様」)

本研究のデモンストレーション動画を、

に掲載させて頂きました（2010年10月12日）。

VocaWatcher Demo02a

VocaWatcher デモ (使用楽曲: 「Packaged」、作詞・作曲・編曲: 「kz 様」、合成音源「メグッポイド」、お手本歌唱「サリヤ人様」)

VocaWatcher Demo02b

VocaWatcher デモ (「逢路（おうろ）」、作詞・作曲・編曲: 「ルシュカ様」、合成音源「VY1」、お手本歌唱「ルシュカ様」)

技術の詳細:

VocaListener（ぼかりす）の技術的な詳細に関しては、「VocaListener: ユーザ歌唱の歌い方を真似る歌声合成パラメータを自動推定するシステム」をご覧ください。ただし、今回新規開発した「ブレス音の自動検出＆合成技術」については、今後、学会発表予定です。

VocaWatcher（ぼかうお）の技術的な詳細に関しては、今後、学会発表予定です。

VocaListener で歌うサイバネティックヒューマン HRP-4C 未夢 p.1

VocaListener で歌うサイバネティックヒューマン HRP-4C 未夢 p.2

VocaListener で歌うサイバネティックヒューマン HRP-4C 未夢 p.3

VocaListener で歌うサイバネティックヒューマン HRP-4C 未夢 p.4

VocaListener で歌うサイバネティックヒューマン HRP-4C 未夢

中長期的な展望:

本研究では「お手本の模倣」を出発点としています。これは、ロボットの制御パラメータ、歌声合成の制御パラメータの空間で、「自然さ」をまずはきちんと表現できるようにすべきだと考えているからです。現在の科学技術は、まだそこが十分には達成できていません。そして、ひとたびそうしたパラメータ空間内で自然さが表現できれば、将来の次の段階として、そのモデル化（コンテキストの時間変化とパラメータ空間内での制御点の時間変化の対応関係の機械学習）が、より適切に実現可能になっていくと考えています。これにより模倣を越えた新たな表現が可能となります。

また、人間の表現は毎回変動を伴いますが、ロボットの表現は再現性が高く、様々な実験で統制がとりやすい利点があります。例えば、視線の制御を停止した場合、あるいは、あるパラメータ制御にバイアスをかけた場合に、ロボットが表出する表現がどう変化するか等を探ることもでき、それ自体が新たな研究プラットフォームになり得ることを期待しています。

ヒューマノイドロボットは多くの人々の関心を惹き付けやすく、ロボット技術のエンターテインメント産業への展開は、その関心の高さに裏付けられた有望な応用事例です。しかし、より長期的には、将来、ロボットが人々の暮らしの一端を支える時代になったときに、ロボットが違和感なく人間社会に溶け込めるようにするための技術として、本研究は寄与していきます。ロボットにとって人間とのより自然なコミュニケーションは重要な機能であり、本研究が達成する「自然さ」を実現する技術は、声の音響信号処理技術や顔の画像処理技術、それらに基づく制御技術と相俟って、未来社会において求められていく技術になると考えています。

公的研究機関がこうした研究をする重要性については、本研究所の理事長からのメッセージ（座談会「広く研究を駆動する人型ロボット」のページ末尾の発言）もご覧ください。

Acknowledgments:

本研究では、ヤマハ株式会社の開発した Vocaloid 2 の応用商品である、クリプトン・フューチャー・メディア株式会社の「初音ミク」、株式会社インターネットの「メグッポイド」、ヤマハ株式会社の「VY1」を使用させていただきました。

本研究では、権利者の許可を得て、楽曲「Packaged」（作詞・作曲・編曲: kz 様）、楽曲「逢路（おうろ）」（作詞・作曲・編曲: ルシュカ様）、 RWC 研究用音楽データベース(ポピュラー音楽 RWC-MDB-P-2001) を使用しました。

References:

VocaListener
- VocaListener: ユーザ歌唱の歌い方を真似る歌声合成パラメータを自動推定するシステム
サイバネティックヒューマン HRP-4C 未夢
- 産業技術総合研究所プレスリリース「人間に近い外観と動作性能を備えたロボットの開発に成功」

References:

中野倫靖, 後藤真孝, 梶田秀司, 松坂要佐, 中岡慎一郎, 横井一仁:
VocaWatcher: ユーザ歌唱の顔表情を真似るヒューマノイドロボットの顔動作生成システム,
情報処理学会論文誌,
Vol.55, No.3, pp.1222-1235, March 2014.
[論文PDF]
後藤真孝, 中野倫靖, 梶田秀司, 松坂要佐, 中岡慎一郎, 横井一仁:
"人間の歌い方を真似る歌声合成システムVocaListenerとロボット顔動作生成システムVocaWatcher",
システム/制御/情報(システム制御情報学会誌),
Vol.56, No.5, pp.249-255, May 2012.
Masataka Goto, Tomoyasu Nakano, Shuuji Kajita, Yosuke Matsusaka, Shin'ichiro Nakaoka, and Kazuhito Yokoi:
"VocaListener and VocaWatcher: Imitating a Human Singer by Using Signal Processing",
In Proceedings of the 2012 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2012),
pp.5393-5396, March 2012.
[PDF]
中野倫靖, 後藤真孝, 梶田秀司, 松坂要佐, 中岡慎一郎, 横井一仁,
"VocaWatcher: 人間の歌唱時の表情を真似るヒューマノイドロボットの顔動作生成システム,"
情報処理学会音楽情報科学研究会研究報告, Vol.2012-MUS-94, No.6, pp.1-10
February 2012.
[PDF][発表資料PDF]
梶田秀司, 中野倫靖, 後藤真孝, 松坂要佐, 中岡慎一郎, 横井一仁,
"ヒューマノイドロボットの自然な歌唱動作生成,"
第29回日本ロボット学会学術講演会,
September 2011.
[PDF]
Shuuji Kajita, Tomoyasu Nakano, Masataka Goto, Yosuke Matsusaka, Shin'ichiro Nakaoka, and Kazuhito Yokoi,
"VocaWatcher: Natural Singing Motion Generator for a Humanoid Robot,"
In Proceedings of the 2011 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2011),
pp.2000-2007, September 2011.
[PDF][DOI (IEEE Xplore)]

The copyright of each publication is retained by the corresponding academic society (copyright holder). Copyright and Consent Form (IEEE).

Shuuji Kajita, Tomoyasu Nakano, Masataka Goto, Yosuke Matsusaka, Shin'ichiro Nakaoka, Yoshio Matsumoto, and Kazuhito Yokoi.

Copyright (C) 2010 by National Institute of Advanced Industrial Science and Technology (AIST).

VocaListener（ボーカリスナー）で歌うサイバネティックヒューマン HRP-4C 未夢（ミーム）

VocaWatcher (ぼかうお): ユーザの歌い方を真似ることが可能なロボットの顔表情合成システム

デモンストレーション動画: ニコニコ動画 YouTube

デモ展示情報:

メディア報道、記事一覧:

研究のポイント:

研究のねらい:

研究内容:

Demonstrations:

技術の詳細:

中長期的な展望:

Acknowledgments:

References:

References:

デモンストレーション動画:　ニコニコ動画　 YouTube