中国 Tencent(テンセント)の Hunyuan チームが最近、高品質なマルチビュー(多視点)形状生成を目的とした 2 つの新しい 3D 生成モデル「 Hunyuan3D 2.0 MV」と「 Hunyuan3D 2.0 Mini 」をリリースしました。これらのモデルは、テキストや画像から精密な 3D コンテンツを生成するための最新技術を取り入れています。
「 Hunyuan3D 2.0 MV」(MV は Multi-View の略)は、複数の視点の画像(前面、背面、側面など)から一貫性のある 3D モデルを生成することに特化しています。従来の 1 枚の画像のみで動作するモデルとは異なり、マルチビュー入力に対応しており、全方向から正確な形状を再現できるのが特徴です。このモデルは 11 億のパラメータ(1.1B)を持ち、ゲームデザインや映画制作、建築ビジュアライゼーションなど、多視点からの再構築が求められる用途に適しています。
一方、「 Hunyuan3D 2.0 Mini 」は軽量版モデルで、パラメータ数が従来の 11 億から 6 億(0.6B)に削減されています。それでも高品質な 3D 形状生成能力を維持しつつ、処理速度が速く、リソース消費が少ないため、Apple M1 Pro チップや NVIDIA RTX 4080 GPU などの消費者向けハードウェアでも動作します。小規模プロジェクトやリアルタイム処理が求められるアプリケーションに適しています。
両モデルともオープンソースとして公開されており、開発者コミュニティやクリエイティブなプロジェクトでの利用が容易になっています。また、30 秒以内で高精度なモデル生成が可能で、OBJ や FBX など一般的な 3D フォーマットに加え、STL や USDZ 形式もサポートしています。
これらの技術は、ゲーム開発における背景オブジェクトや小道具の迅速な生成、製品デザインにおけるプロトタイプ画像からの精密な 3D モデル作成、教育における技術的詳細に煩わされない創造的環境の提供、既存オブジェクトの写真から複製可能な 3D プリントモデルの作成など、幅広い分野での応用が期待されています。