DreamGaussianは1枚の画像からたった数分で3Dモデルを生成する|鍵となるのは3D空間における新たな描画方法「3Dガウススプラッティング」
3Dデータ生成にかかる時間が従来のおよそ7分の1に?
昨年からリリースラッシュとなっている「画像から3Dモデルを生成するツール」。
どこか「雨後の筍」という慣用句さえ脳裏をちらつく昨今の状況だが、しかしこれは単なる流行現象ではない、一つの大きなムーブメントとなりつつある。
そして何より驚くべきは技術的進歩の速度だ。3Dモデル化の精度、速度の向上は目覚ましく、数ヶ月前の情報が古くさく感じられてしまうほど。今はその進歩の一歩一歩をリアルタイムで堪能するのが良いのかもしれない。
いまSNS上で大きく話題となっている「DreamGaussian」もまた驚きの性能を携えている。
このアプリは1枚の画像を超高速で3Dモデルに変換するというもので、いわくその速度は従来の速度のおよそ10倍とのこと。ここでいう従来の速度とは主に「NeRF」を使用した場合の速度のことだ。
引用・ DreamGaussian
NeRFと言えば本ブログ欄でも何度も取り上げてきたニューラルネットワークを使用した画像生成技術である。Luma AIを始めとする様々なアプリやツールに用いられており、その生成スピードや再現度の高さにおいて注目を集めてきた。
しかし、以下の動画によれば同等の品質の3Dモデルを生成する上において、DreamGaussianは2分以内で完了しているのに対し、NeRFでは15分ほどかかってしまっていることがわかる。
引用・ DreamGaussian
これは確かに速い。さらにDreamGaussianにおいてはテキストからの3Dモデル変換も可能であり、シンプルなキーワードならばかなり正確なデータが得られることが分かっている。
引用・ DreamGaussian
3D空間における新たな描画方法「3Dガウススプラッティング」
なんでも、この高速度と精巧さの鍵となっているのは「3Dガウスプラッティング」と「メッシュテクスチャの精緻化」であるという。
3Dガウススプラッティングとは、今年にアメリカで開催された国際的なCG学会・展示会「SIGGRAPH」にて発表された3D空間における新たな描画方法のこと。ポリゴンは一切使用せずガウスと呼ばれる色情報を重ね塗りしていくことを特徴とし、言うなればモデルがどのようなジオメトリを有しているかではなく、それがカメラからどのように見えるかというポイントに特化した方法となっている。それによって今までにない高速描画を実現している。
引用・ DreamGaussian
DreamGaussianではこの最先端の手法が取り入れられ、さらにメッシュの精緻化を図ることで、今までにない形の3Dモデル生成が可能になっているのだ。
気になるDreamGaussianの使い勝手
さて、実際のDreamGaussianの使い勝手はどうなのだろうか。ざっくりまとめると「データ生成速度は確かにかなり速く」なっているが、「3Dデータとしては粗さもあり」「特に画像の背面部分に関しては生成しきれないケースも多い」ようだ。
とはいえ、たった1枚の画像から数分で生成したデータとしてはそれが驚愕に値する技術であることは間違いない。依然として事後処理は必要なものの、これまでの作業時間を大幅に短縮してくれるという点においては、極めて重要な進歩といえよう。
なにより注目なのは3Dガウススプラッティングの可能性だ。このソースコードは開発者向けプラットフォームであるGitHubで公開されているため、一定のコーディング知識があれば自分で試してみることもできる。業界内では「将来の3Dのあり方を塗り替える可能性がある」とも言われており、今後ますます注目を集めていくだろうことは確実だ。
まさに3Dモデル生成の戦国時代に突入ということだろうか。この動乱の行方から目が離せない。