「Neuralangero」は2Dビデオデータを正確な3Dモデルに変換する|NVIDIAのとどまることない革新
2D映像のダビデ像が直ちに3D立体彫刻に
AIソフトウェアの革新が止まらない。
先日、NVIDIA Researchはニューラルネットワークを使用した新しいAIモデル「Neuralangero(ニューラランジェロ)」を発表した。このNeuralangeroとは、2Dのビデオクリップを高精度な3Dモデルに変換するという画期的なソフトウェアである。
まずはリリースされた映像をご覧いただきたい。
2D映像に映し出されるミケランジェロのダビデ像、レストランホール、トラック、遊園地の遊具をNeuralangeroに読み込ませることで、それらが直ちに3Dモデルに変換されている様子がうかがえる。
この2Dビデオから3Dアセットへの変換能力は従来の方法を大幅に上回っているという。なにより注目すべきは、2Dビデオに対する3Dモデルの忠実度だろう。Neuralangeroの研究担当シニアディレクターであるMing-Yu Liu氏は次のように述べている。
「このツールにより、開発者は最終的に、小さな彫像であれ巨大な建物であれ、詳細なオブジェクトをビデオ ゲームや産業用デジタルツインの仮想環境にインポートできるようになります」
革新の鍵はAIを用いた画像生成技術「NeRF」にある
もちろん、これまで3Dスキャンツール、3Dキャプチャツールは存在したし、その技術的進歩には目を見張るものがあった。
たとえば、その代表的な存在として2022年にそのベータ版が公開された3DキャプチャツールLUMA AIがある。LUMA AIはその表現力の高さ、手軽さ、迅速さにおいて極めて高い評価を受けているが、実はLUMA AIの特徴であるその表現力もまた、NVIDIAが提供しているNeRFというAIを用いた画像生成技術にある。
今回のNeuralangeroにもこのNeRFが使用されている。それにより、反復的なテクスチャパターン、均一な色、および強い色の変化を正確にキャプチャすることが可能になっている。
Neuralangeroの詳細については6月18~22日にバンクーバーで開催されるCVPR会議において発表される予定とのことだ。なんでもNeuralangeroはNVIDIA Researchによる約30プロジェクトのうちの1つなのだという。
その30のプロジェクトのうちの一つであるDiffCollageもまた興味深い。これは超ワイドや360度のパノラマ、ループモーション画像などのコンテンツを作成するもので、標準アスペクト比の小さな画像をコラージュして大きなコンテンツを生成してくれるという。
今後、NVIDIAの技術がアート制作、ゲーム開発、ロボット工学など様々な業界で大いに役立てられていくだろうことは間違いない。さらなる展開に期待したい。