OpenAI、待望のAIビデオ生成モデル「Sora」を正式リリース – 高解像度・高速生成を実現

投稿者:

待望のSoraがついにリリースされました。

OpenAIは、待望のAIビデオ生成モデル「Sora」を2024年12月9日に正式にリリースしました。Soraは、テキストプロンプト、静止画、または既存の動画を入力として受け取り、新しい動画を生成するAIモデルです。ChatGPT PlusおよびProのサブスクライバー向けに提供されており、専用のプラットフォーム(sora.com)を通じて利用可能です。

Soraは、最大1080p解像度で20秒までのビデオを生成可能で、ワイドスクリーン、縦型、正方形など様々なアスペクト比に対応しています。新バージョンの「Sora Turbo」では、以前のモデルと比較して大幅に処理速度が向上しています。主な機能として、テキストプロンプトからのビデオ生成、静止画からの動画生成、既存ビデオの拡張や編集などがあります。

利用条件は、ChatGPT Plusユーザー(月額20ドル)では月間50本の480pまたは720p動画生成が可能で、ChatGPT Proユーザー(月額200ドル)ではより高解像度、より長い動画時間、「10倍の使用量」が提供されます。安全性への取り組みとして、有害コンテンツの生成を防止する対策や、電子透かしデータ(C2PAメタデータ)を全生成動画に組み込むことでコンテンツの識別と出所確認を可能にしています。

正式リリース後、多くのユーザーが実際に動画を生成し、自作作品を次々と公開しています。その動画を見る限り、クオリティはかなり高いようです。特に、ドローン映像のような視点や風景表現に優れている点が特徴です。一方で、苦手な部分も指摘されています。例えば、物理法則に基づく動きに不自然さが残ることや、人間や動物の複雑で長時間にわたる動作表現には課題があるとされています。また、現時点ではヨーロッパでの利用が制限されています。

OpenAIのSam Altman CEOは、このビデオ技術はまだ初期段階であるものの、「今後さらに大きく改善される」と述べています。

Soraの正式リリースを待つ間、Runwayなど他の動画生成AIモデルも随分と進化しているので、圧倒的な性能というわけではないのでしょうが、十分に対抗できるものとなっているようです。また、利用するインターフェイスの使い勝手はシンプルで使いやすいと評判です。