スピーチ音声からオバマ前大統領をCG映像化。ニューラルネットワーク鍛え口元部分を自動生成

不気味の谷はクリア済み

Munenori Taniguchi

6 時間前 in AV

75 シェア

連載

編集部オススメガジェット

お役立ちiPhone Tips

連載をすべて見る

注目記事

kddi

「好きな2次元キャラと現実世界で過ごしたい」を叶えるAR、auが開発。仙台で体験イベント

小口貴宏 (TAKAHIRO KOGUCHI), 7月8日

View

マリオカートもVRで楽しめる「VR ZONE SHINJUKU」、歌舞伎町に7月14日オープン

小口貴宏 (TAKAHIRO KOGUCHI), 6月13日

View

smartphone

購入レポ、Galaxy S8を買ったワケ。手にした瞬間ハッとしてグッときてやってきた未来感

津田啓夢(Hiromu Tsuda), 6月10日

View

docomo withは好調、au新料金には追従しない--ドコモ吉澤社長インタビュー（週刊モバイル通信石野純也）

石野純也 (Junya Ishino), 13 時間前

View

asus

1万9800円のSIMフリースマホ「ZenFone Live」7月14日発売決定、シリーズ最小5インチ液晶

小口貴宏 (TAKAHIRO KOGUCHI), 9 時間前

View

smartphone

速報：auが1980円からの新スマホ料金プラン『ピタットプラン』発表。データ量に合わせての料金自動変更を導入

橋本新義 (Shingi Hashimoto), 7月10日

View

　
ワシントン大学の研究チームが、バラク・オバマ前合衆国大統領の映像をインターネット上から大量に集め、スピーチからCG合成のバーチャル・オバマ大統領をリアルタイム合成する技術を生み出しました。

この技術のポイントは、合成する映像に映るオバマ大統領すべてをCG製作するのではなく、口の動きの部分だけをスピーチの動きに合わせた形に合成しているところ。わかりやすくいえば、CGにリップ・シンク(口パク)をさせるわけです。
　

　
こうした口パク合成技術の開発動機について、チームのIra Kemelmacher-Shlizerman准教授は、SkypeやMessengerなどのビデオ会議システムにおいてしばしば映像が乱れたり帯域不足で通話が切れたりするため、音声から話者の顔を合成することでスムーズな会話ができるようになると考えたとのこと。また応用として歴史上の人物と自由に会話するようなアプリケーションも開発可能になるとしています。

ワシントン大学が開発した技術では、まずインターネット上からオバマ大統領のスピーチ映像14時間分をかき集め、その音声と口の動きをニューラルネットワークに叩き込みました。そして合成対象となるスピーチのオーディオトラックからオバマ前大統領の口もと映像を出力し、別のスピーチ映像に合成、口の動きと頭部の動き、音声とのタイミングを微調整するまでの一連の処理を自動で実行します。

出来上がった映像はご覧の通りで、見るからに自然なスピーチ映像に仕上がっているといえるでしょう。チームはニューラルネットワークのトレーニングにつかった映像時間の違い(3分 /1時間 /7時間 /14時間)を並べ、鍛えるほど自然な映像になることをわかりやすく示しています。

ただ、チームは映像では判別しにくい"th"の発音などのように、舌の位置で変わる発音における口もとの形状に誤りが残っているところと、口まわりだけの合成であるゆえに、話の内容に合わせて変化する表情が再現できないところについてはさらなる改善が必要だとしました。
　

　
なお、この技術はまずニューラルネットワークを鍛え上げるために長時間の映像が必要となります。オバマ氏の場合は簡単に入手できるから良いものの、一般人の場合はそうは行きません。とはいえ、もともとビデオチャットツールでの映像改善を考えての技術であるため、ビデオ通話を何度も行うことでニューラルネットワークも鍛えられていくようにはできるはずです。

ちなみに、この研究にはGoogle /サムスン /Facebook /インテルなどが資金を提供しており、チームは今回の実験で14時間分のトレーニング用のデータが必要だったところを、1時間で済むように開発を続けるとしています。

戻る

このページは以下ＵＲＬのキャッシュです
http://japanese.engadget.com/2017/07/12/cg/

日本版

映画音楽のようなサウンドスケープが作れる「SynthScaper」アプリ公開。アンビエントサウンドを手軽に制作

プリンスの公式ビデオがYouTubeに公開。アルバム｢Purple Rain｣収録曲PV、ライブ映像も

VR/ARメガネなしに立体的な映像を操れるNo-logram。画像解析と深度センサーで人の位置に合わせ映像生成

Sponsored Contents

AVの最新記事

スピーチ音声からオバマ前大統領をCG映像化。ニューラルネットワーク鍛え口元部分を自動生成

不気味の谷はクリア済み

連載

週刊モバイル通信

情熱のミーム

電脳オルタナティヴ

週刊VR情報局

旅人目線のデジタルレポ

海外スマホよもやま話

編集部オススメガジェット

お役立ちiPhone Tips

注目記事

「好きな2次元キャラと現実世界で過ごしたい」を叶えるAR、auが開発。仙台で体験イベント

マリオカートもVRで楽しめる「VR ZONE SHINJUKU」、歌舞伎町に7月14日オープン

購入レポ、Galaxy S8を買ったワケ。手にした瞬間ハッとしてグッときてやってきた未来感

人気記事

docomo withは好調、au新料金には追従しない--ドコモ吉澤社長インタビュー（週刊モバイル通信石野純也）

1万9800円のSIMフリースマホ「ZenFone Live」7月14日発売決定、シリーズ最小5インチ液晶

速報：auが1980円からの新スマホ料金プラン『ピタットプラン』発表。データ量に合わせての料金自動変更を導入

Sponsored Contents

開発秘話も続々。熱気あふれる『Galaxy S8|S8+降臨祭』イベントレポ

BMWもフォーミュラE ワークス参戦を正式発表。市販EVの｢走る実験室｣としてパワートレインなど開発

LG Q6発表。18:9の縦長ディスプレイ搭載、G6 miniと呼べそうなミドルクラス端末

ニンテンドースイッチ『ニコニコ』アプリまもなく配信。動画サービス一番乗り

開発秘話も続々。熱気あふれる『Galaxy S8|S8+降臨祭』イベントレポ

1万9800円のSIMフリースマホ「ZenFone Live」7月14日発売決定、シリーズ最小5インチ液晶

LINE、1万円で買えるAIスピーカー「Wave」先行版を7月14日から予約受付

戻るこのページは以下ＵＲＬのキャッシュですhttp://japanese.engadget.com/2017/07/12/cg/

映画音楽のようなサウンドスケープが作れる「SynthScaper」アプリ公開。アンビエントサウンドを手軽に制作

プリンスの公式ビデオがYouTubeに公開。アルバム｢Purple Rain｣収録曲PV、ライブ映像も

VR/ARメガネなしに立体的な映像を操れるNo-logram。画像解析と深度センサーで人の位置に合わせ映像生成

Sponsored Contents

AVの最新記事

週刊モバイル通信

情熱のミーム

電脳オルタナティヴ

週刊VR情報局

旅人目線のデジタルレポ

海外スマホよもやま話

編集部オススメガジェット

お役立ちiPhone Tips

「好きな2次元キャラと現実世界で過ごしたい」を叶えるAR、auが開発。仙台で体験イベント

マリオカートもVRで楽しめる「VR ZONE SHINJUKU」、歌舞伎町に7月14日オープン

購入レポ、Galaxy S8を買ったワケ。手にした瞬間ハッとしてグッときてやってきた未来感

docomo withは好調、au新料金には追従しない--ドコモ吉澤社長インタビュー（週刊モバイル通信 石野純也）

1万9800円のSIMフリースマホ「ZenFone Live」7月14日発売決定、シリーズ最小5インチ液晶

速報：auが1980円からの新スマホ料金プラン『ピタットプラン』発表。データ量に合わせての料金自動変更を導入

開発秘話も続々。熱気あふれる『Galaxy S8|S8+降臨祭』イベントレポ

BMWもフォーミュラE ワークス参戦を正式発表。市販EVの｢走る実験室｣としてパワートレインなど開発

LG Q6発表。18:9の縦長ディスプレイ搭載、G6 miniと呼べそうなミドルクラス端末

ニンテンドースイッチ『ニコニコ』アプリまもなく配信。動画サービス一番乗り

開発秘話も続々。熱気あふれる『Galaxy S8|S8+降臨祭』イベントレポ

1万9800円のSIMフリースマホ「ZenFone Live」7月14日発売決定、シリーズ最小5インチ液晶

LINE、1万円で買えるAIスピーカー「Wave」先行版を7月14日から予約受付

戻る

このページは以下ＵＲＬのキャッシュです
http://japanese.engadget.com/2017/07/12/cg/

docomo withは好調、au新料金には追従しない--ドコモ吉澤社長インタビュー（週刊モバイル通信石野純也）