画像生成AI「DALL-E 2」や高性能AI言語モデル「ChatGPT」などさまざま人工知能をオープンソース化している非営利団体OpenAIは新たに、テキストから3Dモデルを生成するAI「Point-E」のソースコードを公開しました。
テキストから3Dモデルを生成する人工知能はこれまで、Googleが発表した「DreamFusion」やNVIDIAの「Magic3D」がありましたが、「Point-E」はこれまでのtext-to-3Dモデルよりも遥かに短時間で生成することが可能になったとしている。
Point-Eが生成する3Dモデル
Point-Eは従来のようなポリゴンメッシュの3Dオブジェクトを作成するのではなく、小さい粒を集合させた「点群データ」の3Dオブジェクトを生成します。この「点群データ」の3Dオブジェクト生成が従来に比べ高速化している要因になっているという。
実際にオンライン上でPoint-Eを実行できるHugging Faceで試したところ、数分から10分程度で以下のような「点群データ」の3Dオブジェクトを生成することができました。
点群データの利点として3Dオブジェクトを生成しやすいという点がありますが、一方で細かい形状やテクスチャを再現できないという欠点があり、その欠点を補うために、点群からポリゴンメッシュに変換するシステムもPoint-Eには実装されています。
発表された論文では失敗例もいくつか挙げられており、OpenAIの研究チームは「Point-Eはテキストから3Dオブジェクトを生成する技術の出発点になるだろう」と述べている。
Point-EのオープンソースコードはGitHubにて公開されています。
GitHub Point-E
▶︎https://github.com/openai/point-e
Hugging Face Point-E demo
▶︎https://huggingface.co/spaces/openai/point-e
ARTICLE