Googleは、AIによる動画・画像生成技術の最新モデルとして、「Veo 2」と「Imagen 3」を発表しました。
Veo 2は、Google DeepMindが開発した次世代の動画生成AIです。最大4K解像度で2分以上の高品質な動画を生成可能で、物理法則に則った動きや人間の動きをリアルに再現します。低画角のトラッキングショットやクローズアップなど、様々なシネマティックエフェクトにも対応しています。現在はGoogle LabsのVideoFXツールを通じて利用可能で、2025年にはYouTube Shortsなどへの統合が予定されています。(デモ動画へ)
一方、Imagen 3は画像生成モデルの最新版で、明るく色彩豊かで詳細な画像を生成します。フォトリアリズムから印象派、抽象画、アニメまで幅広いスタイルを再現可能で、特定のカメラアングルやテクスチャの表現も向上しています。Google LabsのImageFXツールを通じて、既に100カ国以上で利用可能となっています。
これらのモデルは、映画製作やYouTubeコンテンツ制作、企業の広告・マーケティング素材作成、アーティストの創作活動など、様々な分野での活用が期待されています。Googleは、SynthIDという透かしの導入により、AI生成コンテンツの誤情報防止にも取り組んでいます。
正直なところ、発表の仕方で負けていて、OpenAIに比べると今ひとつ話題性に欠けるのですが、Googleも年末に向けてOpenAIと同程度以上の機能を続々とリリースしています。現在のところ、テキスト・画像・動画のそれぞれの生成モデルを総合的に高いレベルでリリースしている企業はOpenAIとGoogleに絞られています。それをxAIとMetaが一足遅れて追っている、ようなイメージです。