Google は 2025 年 10 月 15 日、AI 動画生成モデル「 Veo 3.1 」を発表しました。前モデル「 Veo 3 」のアップデート版となる本モデルは、映像品質の向上、編集機能の強化、音声生成の統合という 3 つの柱で進化を遂げています。
最大の注目点は、音声生成が正式に統合されたことです。これまで映像中心だった Veo シリーズですが、今回のアップデートで映像のトーンや動きに合った音響を AI が生成するようになり、より自然な「映像+音」の体験が実現されました。
編集機能も大きく進化しています。「 Ingredients to Video 」機能では、最大 3 枚のリファレンス画像を入力すると、キャラクターやビジュアルの一貫性を保ちながら映像を構築してくれます。これにより、AI 動画の課題だった「人物の同一性維持」や「画風統一」が大幅に改善されました。また、開始と終了の画像から自然な動きを生成する「 First and Last Frame 」や、映像の最後の数秒から新しい映像を生成して繋げることで最大 1 分以上の連続映像を作れる「 Scene Extension 」も追加されています。
解像度は 720p・1080p 出力に対応し、縦横(16:9/9:16)の両フォーマットをサポート。皮膚・水・布といった質感表現も向上し、生成動画のリアルさが増しています。
Veo 3.1 は Google の映像制作ツール Flow に統合されており、Gemini アプリや Vertex AI API からも利用できます。標準版と高速版の 2 つが用意され、用途に応じた使い分けが可能です。
今回の発表は、OpenAI の Sora 2 が話題になった直後というタイミングでした。Sora がバイラル映像に特化して注目を集めたのに対し、Google は映画制作者やプロクリエイター向けに「編集の精密さ」と「物語構成力」を重視する方向性を明確にしています。AI 動画生成が、単なる「面白い動画を作るツール」から本格的な「創造的制作ツール」へと進化しつつあることを示した発表といえるでしょう。
