イスラエルの Lightricks LTXV 、 60 秒を超える長尺 AI 動画生成を実現

投稿者:

2025 年 7 月 16 日、イスラエルの AI スタートアップ Lightricks はオープンソースの動画生成 AI 「 LTX-Video ( LTXV )」の大型アップデートを発表しました。このアップデートにより、 60 秒を超える長尺の動画を画像から動画に変換できるようになり、業界標準(従来は約 8 秒)を大きく上回る性能を実現しました。

最も注目すべき特徴は、リアルタイムストリーミング生成機能です。動画生成と同時に映像が再生される「リアルタイムプレビュー」に対応し、生成開始から 1 秒未満で最初の映像が表示され、以降は連続的に映像が作成されていきます。また、動画生成中にプロンプトや指示を追加・変更できるため、シーン展開やストーリー性のある映像制作も可能です。

技術面では、前のフレームの情報を活用して次のフレームを順次作成する方式を採用しており、長時間の動画でも映像に一貫性を保ったストーリー展開が可能です。最大 30fps のフレームレートと 1216×704 の高解像度に対応し、まず大まかな動きを作成してから詳細を加える段階的な生成手法により、効率的で品質の高い映像制作を実現しています。

従来の競合モデル( OpenAI の Sora や Runway の Gen-4 など)が強力なエンタープライズ向け GPU を必要とするのに対し、 LTXV は Nvidia RTX 4090 などの家庭用 GPU でも高速動作します。 24GB VRAM 搭載の PC やノートブックでも実用的な速度と品質を誇り、最大で競合モデルの 30 倍の速度を実現しています。

130 億パラメータの LTXV-13B モデルは、まず低解像度で動きの大まかな骨組みを作り、その後に細部を詳しく作り込んでいく手法を使っています。文章から動画、画像から動画、動画から動画への変換に対応しており、人物のポーズ、奥行き、輪郭線などの要素を細かく調整できる機能も備えています。

訓練データには Getty Images や Shutterstock からライセンス取得した素材を使用しており、商用利用時の安全性と倫理的な使用が保証されています。モデルの重みと実装は GitHub や Hugging Face で LTXV Open Weights License のもとで無料公開されており、個人クリエイターから小規模チームまで広く利用できます。

この LTXV アップデートは「 60 秒の壁」を突破した初のリアルタイム長尺 AI 動画生成モデルとして、 AI 動画分野での新たな業界標準となる可能性を秘めています。消費者向け GPU でも高速動作し、プロンプトのライブ制御や多様な派生ワークフローに対応することで、長編 AI 動画ストーリーテリングの新時代を切り開く重要な進歩といえるでしょう。