Lightricks が発表した「LTXV-13B」は、AI ビデオ生成分野において画期的な進化をもたらすモデルです。従来の AI ビデオ生成モデルと比較して最大 30 倍の速度で高品質な映像を生成できる上、一般消費者向けのハードウェア(デスクトップ PC やハイエンドノート PC)でも動作する点が大きな特徴です。
LTXV-13B の最大の技術的革新は「マルチスケールレンダリング」です。まず低解像度で全体の動きや構図を粗くスケッチし、その後タイルごとに詳細・ライティング・微細な動きを段階的に追加することで、効率的かつ高品質なビデオ生成を実現しています。この手法により、最終的な解像度ではなく「タイルサイズ」によってメモリ(VRAM)使用量が決まるため、メモリ効率が大幅に向上しています。
具体的な実績として、同等の競合モデルが 1,491 秒かかるビデオ生成を、LTXV-13B はわずか 37.5 秒で完了できたとされています。NVIDIAの RTX 3090、4090、5090 などの一般的なコンシューマー向け GPU で動作します。
LTXV-13B は Hugging Face や GitHub でモデル本体とツールが公開されており、年間収益が 1,000 万ドル未満の組織や個人であれば無料で利用できます。ただし、厳密には「オープンソース」ではなく「オープンウェイト(重み公開)」モデルであり、商用利用や大規模利用には追加ライセンスが必要な場合があります。
また、Getty Images や Shutterstock など大手ストックメディア企業との戦略的提携により、高品質かつ商用利用可能なデータセットでトレーニングされています。これにより、著作権や倫理面にも配慮した AI 生成が可能です。
Lightricks の LTXV-13B は、これまで高価なハードウェアやクラウドサービスが必要だった高品質 AI ビデオ生成を、一般ユーザーや中小企業でも手軽に利用できるようにした、AI ビデオ生成の「民主化」を推進するモデルと言えます。