イーロン・マスク率いる xAI は、画像・動画生成 AI 「 Grok Imagine (グロック・イマジン)」を iOS 版の X アプリで正式リリースしました。現在は SuperGrok および X の Premium+ の有料会員向けに提供されており、 Google や OpenAI 、 Runway などが激しく競争する AI 動画生成市場への本格参入となります。
Grok Imagine の最大の特徴は、テキストや画像から最長 15 秒の動画を音声付きで生成できることです。競合他社と比較すると、 OpenAI の Sora は最長 20 秒、 Google の Veo 3 は 8 秒、 Runway の Gen-4 は最長 10 秒となっており、 Grok Imagine は中程度の長さとなっています。音声生成については、 Google Veo 3 が会話や効果音、 BGM を含む音声付き動画を生成できる一方、 OpenAI Sora や Runway Gen-4 は音声なしの動画のみとなっています。
生成速度の面では、競合他社の AI 動画モデルが画像 1 枚を生成する時間の半分から 4 分の 1 という高速処理を実現しています。また、生成結果をその場で修正したり、何度も生成を繰り返せるリアルタイム編集機能も搭載されています。
話題となっているのが「スパイシーモード」という機能です。これは部分的なヌード画像や性的なコンテンツの生成を可能にするもので、他の主要 AI サービスが設けている厳格な制限とは一線を画しています。ただし、あまりに露骨なプロンプトについてはモザイク処理などの制限が設けられており、完全に自由というわけではありません。
現在の提供範囲は iOS アプリの SuperGrok (月額 30 ドル、約 4410 円)または X の Premium+ 会員に限定されていますが、 Android 版は数日以内のリリースが予定されています。一般ユーザー向けには 10 月以降に段階的な公開が計画されており、規制や安全性の観点から一部地域では身元確認が要請される見込みです。
マスク氏は将来的に生成可能な動画を最大 6 分間まで拡張する計画を明らかにしており、過去に Twitter が展開していた短尺動画サービス「 Vine 」的な文化の復活を目指すとしています。実際、失われたとされていた Vine 動画アーカイブの復元作業も進めていることを発表しており、これが Grok Imagine のコンテンツ作成にどう活用されるかも注目されます。
Grok Imagine は、高速処理と自由度の高さを武器に AI 動画生成市場に参入しました。マスク氏は「毎日改善される」と述べており、競合他社との技術開発競争が今後さらに激化することは間違いありません。