Google、テキストから高品質な音楽を生成する AI モデル「 Lyria 」を発表

投稿者:

Google は 2025 年 4 月 9 日、「 Google Cloud Next ’25 」において、テキストから音楽を生成する AI モデル「 Lyria 」を発表しました。この Lyria は、Google Cloud の生成 AI プラットフォーム「 Vertex AI 」に新たに追加され、これにより Vertex AI は動画・画像・音声・音楽のすべてのモダリティに対応した唯一のプラットフォームになりました。

Lyria の最大の特徴は、テキストによる説明から高品質な音楽トラックを生成できる点です。例えば「深夜のスモーキーなジャズクラブの雰囲気」といったプロンプトから、サックスとトランペット、ゆったりとしたベースラインなど細部まで再現した音楽クリップを作成できます。対応ジャンルはポップ、ジャズ、クラシック、エレクトロニックなど多岐にわたり、リアルでリッチな音楽を数分以内に生成可能です。

現在 Lyria は Vertex AI のプレビュー版として限定的に利用可能な状態で、一般向けに広く公開されているわけではありません。利用するには Google Cloud アカウントを作成し、 Vertex AI のプレビュー版にアクセスを申請する必要があります。

企業向けの応用としては、マーケティングキャンペーンや店舗内向けのサウンドトラック作成、動画・ポッドキャスト用のロイヤリティフリー音楽の生成などが期待されています。これにより音楽ライセンス費用と制作時間を最大 90% 削減できる可能性があるとされています。

もちろんです。「プロダクションアセット」をより自然な日本語に言い換えると、以下のようになります:


Vertex AI では、Lyria を他の生成系AIモデルと組み合わせて活用することが可能です。たとえば、動画編集を担う「Veo 2」、高品質な画像生成・修復を行う「Imagen 3」、10秒の音声サンプルからカスタムボイスを作成できる「Chirp 3」などと連携することで、テキストプロンプトから映像制作に必要な素材一式を一括で生成することができます。

セキュリティ面では、 SynthID によるデジタル透かしや安全性フィルター、データガバナンス、第三者の知的財産権主張に対する補償制度などが整備されています。

すでにロレアルやクラフトハインツなどの大手企業が Vertex AI を導入しており、ロレアルは 20 ヶ国語対応の動画・画像制作を加速、クラフトハインツは 8 週間かかっていた作業を 8 時間に短縮したという成果が報告されています。