テンセント、動画生成モデル「HunyuanVideo」を発表 - オープンソース最大規模の130億パラメーター

中国のテクノロジー大手テンセントが、新しい動画生成モデル「HunyuanVideo」を発表しました。このモデルは130億のパラメーターを持ち、現時点で最大のオープンソースの動画生成モデルとなっています。

HunyuanVideoは、Runway Gen-3やLuma 1.6など主要な商用モデルを上回る性能を実証しました。特にテキストとの整合性、動きの品質、視覚的品質において優れた評価を獲得しています。生成された動画のプロフェッショナルによる評価では、テキストとの整合性で68.5%、動きの品質で64.5%、視覚的品質で96.4%を達成し、総合評価で競合モデルを上回る結果を示したとのことです。

機能面では、静止画からビデオへの変換、アニメーションアバターの作成、ビデオ用音声生成機能なども備えています。720p解像度で5秒程度のビデオを生成可能で、中国語と英語の両方のプロンプトに対応しています。

HunyuanVideoのリリースは、OpenAIのSoraに対抗する形で行われました。完全オープンソース化により、動画生成技術を促進する狙いがあるとみられています。ByteDanceやAlibaba等の中国企業も同様のツールを開発中とのことです。