TikTok を運営する ByteDance が 2025 年 8 月 28 日、画像生成 AI モデル「 USO ( Unified Style-Subject Optimized customization model )」をオープンソースで公開しました。この技術は、人物や物の特徴をそのまま残しながら、好きな絵のスタイルに変換できる画期的なものです。
これまでの画像生成 AI には大きな問題がありました。絵画風やアニメ風といったスタイルを強くすると、元の人物の顔や特徴が変わってしまう。逆に人物の特徴を保とうとすると、スタイルの表現が弱くなってしまう。この「トレードオフ」問題に多くの開発者が悩んできました。
USO はこの難題を解決しました。例えば、ある人の写真をゴッホの絵画風に変換しても、その人の顔の特徴はしっかりと保たれます。アニメ風に変換しても、元の人だと分かる仕上がりになります。これは約 20 万件という大量のデータを使った独自の学習方法によって実現されています。
学習の仕組みは少し複雑ですが、簡単に言えば「元の画像」「スタイルの見本」「理想の仕上がり」の 3 つ(トリプレット)を組み合わせて AI に教え込んでいます。この方法により、 AI はスタイルと被写体の特徴を別々に理解し、自由に組み合わせられるようになりました。
実際の使い方はとても多彩です。例えば「花屋で働く男性」という設定で、実在の人物の特徴を保ったまま新しい環境での画像を作れます。既存の画像のレイアウトを保ちながら、まったく違うスタイルに変換することも可能です。最も注目されるのは、人物とスタイルを自由に組み合わせて「講演台で話す女性をアニメ風に」といった複雑な要求にも応えられることです。
性能面でも優秀な結果を出しています。画像の品質を測る専門的な指標で、これまでの無料モデルの中では最高スコアを記録しました。これは技術的にも大きな進歩と評価されています。
ByteDance はこの技術をオープンソースで公開しており、プログラムのコードから学習済みのモデル、データまですべてが利用できます。しかも、高性能なコンピューターがなくても、一般的なゲーム用パソコンで動作するよう工夫されています。自宅に環境がない人でも、ウェブ上のデモページで簡単に試すことができます。