テンセント、動画から3D世界を生成するAI「Hunyuan World 1.1」をオープンソース化

投稿者:

中国のテクノロジー大手テンセントは 2025年10月22日、動画や複数の写真から 3D の世界を再構成する AI モデル「Hunyuan World 1.1」(WorldMirror)をオープンソースとして公開しました。このモデルは、AR (拡張現実) や VR (仮想現実)、ゲーム、ロボティクスといった分野におけるアプリケーション開発を加速させることを目的としています。

以前のバージョン 1.0 はテキストや単一画像からの 3D 生成に焦点を当てていましたが、今回の 1.1 では入力ソースが動画や多視点画像へと大幅に拡張され、より実用的なシーンでの利用が見込まれます。

Hunyuan World 1.1 の大きな特徴は、その高速性と柔軟性にあります。フィードフォワードアーキテクチャの採用により、単一の GPU 上で動作し、数秒以内ですべての 3D 属性を出力できます。この高速な推論は、他の類似モデルと比較しても顕著な進歩です。また、カメラのパラメータや深度マップといった情報を柔軟に取り込めるため、幾何学的に一貫性のある高精度な 3D モデルの構築が可能です。

このモデルは、密な点群、多視点深度マップ、そして近年注目されている 3D Gaussian Splatting といった複数の表現形式を、単一のモデルで同時に生成できる包括性も備えています。

テンセントは「Hunyuan AI エコシステム」として、他にも複数の 3D 生成モデルを開発しており、同社がこの分野に注力していることが分かります。例えば、テキストから高解像度な 3D モデルを生成する「Hunyuan 3D-2.0」や、さらに高速な 3D 世界生成を目指す「FlashWorld」などが存在します。

Hunyuan World 1.1 は GitHub で公開されており、Hugging Face 上ではオンラインデモも利用できます。一部のユーザーからは、Gaussian Splatting の品質にはまだ課題があるものの、動画から 3D への変換効果は非常に高いと評価されています。

このような高性能な 3D 再構成モデルがオープンソースとして提供されることで、開発者やクリエイターはこれまで以上に容易に 3D コンテンツを制作できるようになります。ゲームや AR/VR アプリケーションの開発を加速させる可能性を秘めており、今後のエコシステムの発展が注目されます。