Hedra、動画生成AIモデル「 Character-3 」をリリース ー オムニモーダル技術を採用

投稿者:

Hedraは3月7日、画像・テキスト・音声を統合的に処理するAIモデル「Character-3」を正式リリースしました。このモデルは、単にマルチモーダル(複数の入力形式を扱う)を超え、これらの要素を同時に処理する「オムニモーダル」技術を採用。1枚の画像と音声データを入力するだけで、リアルなリップシンクや表情変化を伴うアバター動画を生成できます。

Character-3の最大の特徴は、口の動きだけでなく、表情や首の動きまで自然に反映する技術にあります。これにより、より没入感のある高品質な動画コンテンツの作成が可能になりました。同時に発表された「Hedra Studio」というプラットフォームでは、テキストから動画生成、音声から動画生成、画像のカスタマイズなどの機能が統合されており、シンプルなタイムライン編集機能も備えています。

料金プランは無料から始まります。例えば30秒以内の動画を1日5本までは無料で生成できます(商用利用には制限あり)。また月額$10のベーシックプランでは最大20分間の動画生成が可能で、商業利用にも対応しています。

SNS上での初期の反応を見ると、プラットフォームの使いやすさについては好評で、初心者でも直感的に操作できるインターフェースが評価されています。また、生成された動画を見る限り、かなりフォトリアリスティックで自然な動作の動画が作れています。