NVIDIAのAIツールでエドガーアランポーの肖像画が喋り出す 映像から簡単にアニメーション化できる「Vid2Vid Cameo」と「3D姿勢推定ツール」

NVIDIAのAIツールが視覚効果やアニメーションを手掛けるスタジオ、プロのクリエイター、さらにはカメラを使うすべての愛好家まで、あらゆるレベルのクリエイターのためにディープラーニングを活用したパフォーマンスキャプチャを可能にしている。

NVIDIA Vid2Vid Cameoを使用するとクリエイターはAIを活用してプロ用のカメラやスマートフォンで撮影したあらゆる標準的な2Dビデオから顔の動きや表情をキャプチャできる。そのパフォーマンスをリアルタイムで適用することで、アバターやキャラクター、あるいは絵画のアニメーションを作成することも可能。

一方、3D姿勢推定ソフトウェアを使用すると歩行、ダンス、武術の動きといった全身の動作をキャプチャして、AIで仮想キャラクターに命を吹き込むことができる。3D未経験者でさえ、これらのツールを使えばスマートフォンの映像からでも制作プロジェクトを容易にアニメーション化できる。プロならさらに一歩前進して、姿勢推定ソフトウェアとVid2Vid Cameo ソフトウェアを組み合わせて使用し、ライブストリームやアニメーションプロジェクト用のバーチャルキャラクターに自分自身の動きを転送することもできる。

以下のデモ動画ではエドガーアランポーの詩「Sonnet — to Science」の朗読パフォーマンスをアーティストのゲイリー ケリー(Gary Kelley)氏によるポーの肖像画に投影している。

【動画】Performance Capture Possible With Any Camera with NVIDIA AI



NVIDIAがVid2Vid Cameoを使ったパフォーマンスキャプチャのデモを提供

NVIDIA AI Playgroundのデモを通じて利用可能なNVIDIA Vid2Vid Cameoでは、話している人の顔を生成するのに必要な要素は2つだけ。アニメーション化するアバターか、絵画の静止画像とパフォーマンスする本人が話している映像、歌っている映像、または頭を動かしている映像。

GAN(敵対的生成ネットワーク)に基づくこのモデルは、顔の動きをマッピングしてリアルタイムの動作をキャプチャし、その動作をバーチャルキャラクターに転送する。18万本のビデオを使ってトレーニングされたネットワークは、顔の動きをモデル化するために主要ポイントを20か所特定することを学習済みであり、目、口、鼻、眉毛などの位置をエンコードする。これらのポイントはパフォーマンスする本人のビデオストリームから抽出され、アバターやデジタルキャラクターに適用される。

関連サイト
NVIDIA AI Playground



Vid2Vid Cameo、姿勢推定と各社ビジュアルプラットフォームの統合

Vid2Vid Cameoが詳細な表情をキャプチャするのに対し、姿勢推定AIは全身の動きを追跡する。これは複雑な動作をしたりデジタルシーンを動き回ったりするバーチャルキャラクターを手掛けるクリエイターにとって重要な機能。

Pose Trackerは3Dデザインコラボレーションおよび世界シミュレーションプラットフォームである「NVIDIA Omniverse」の拡張機能として提供されている畳み込みニューラルネットワークモデル。ユーザーはリアルタイムでキャラクターをアニメーション化するための動作のソースとして、映像をアップロードすることもライブビデオを配信することもできる。クリエイターは無料でNVIDIA Omniverseをダウンロードして、ステップ バイ ステップのチュートリアルから開始できる。

NVIDIAのパフォーマンスキャプチャ用AIを自社製品に統合した企業は以下の通り。

Derivative
ノードベースのリアルタイム ビジュアル開発プラットフォームであるTouchDesignerのメーカーで、使いやすい顔追跡機能の実現手段としてVid2Vid Cameoを実装した。

Notch
3D、視覚効果、ライブイベントのビジュアル用にリアルタイムグラフィックスツールを提供する企業で、NVIDIAの姿勢推定AIを利用して、アーティストがステージのセットアップを簡素化できるようにしている。カスタムのハードウェア トラッキング システムを使用する代わりに、Notch ユーザーは標準的なカメラ装置を使って 3D キャラクターのアニメーションをリアルタイムで制御できる。

Pixotope
バーチャルプロダクションの主要企業でNVIDIAのAIを利用したリアルタイムのタレント追跡機能を使って、ライブプロダクションのインタラクティブ要素を促進している。ノルウェーに拠点を置き、直近のNVIDIA GTCで現実要素とスクリーン上のバーチャル要素のインタラクションを可能にする独自の研究を紹介した。

関連サイト
NVIDIA Omniverse
NVIDIA

ABOUT THE AUTHOR / 

山田 航也

横浜出身の1998年生まれ。現在はロボットスタートでアルバイトをしながらプログラムを学んでいる。好きなロボットは、AnkiやCOZMO、Sotaなどのコミュニケーションロボット。

PR

連載・コラム