AI画像生成の最新版「Stable Diffusion 3.5」登場 – カスタマイズ性と多様性が大幅に向上

投稿者:

Stability AIは2024年10月22日、画像生成AIの最新版「Stable Diffusion 3.5」を発表しました。このバージョンは以前のものと比較して、パフォーマンスと多様性が大幅に向上しているのが特徴です。

Stable Diffusion 3.5では、「Large」「Large Turbo」「Medium」の3つのモデルが提供されます。Largeモデルは80億のパラメーターを持ち、1メガピクセルの高解像度画像生成が可能で、プロフェッショナルな用途に最適です。Large Turboモデルは、Largeモデルの蒸留版でわずか4ステップで高品質な画像を生成し、高速処理に特化しています。Mediumモデルは26億のパラメーターを持ち、一般消費者向けハードウェアでの使用に最適化されており、10月29日にリリース予定です。

主な特長としては、特定のニーズに合わせて簡単にチューニングが可能な「カスタマイズ性」、複雑なプロンプトなしでも様々な肌の色や特徴を持つ人物画像を生成できる「多様性」、3D、写真、絵画、線画など幅広い表現スタイルに対応する「スタイルの幅」が挙げられます。

また、前バージョンと比べてよりリアルな画像生成が可能になり、看板などのテキスト要素の描画性能も向上しています。

ライセンス条件は、非商用利用と年間収益100万ドル未満の商用利用は無料で、収益100万ドル以上の場合はエンタープライズライセンスが必要となります。

Stable Diffusion 3.5は、カスタマイズ性、効率性、多様性を向上させた最新の画像生成AIとして、クリエイティブな用途で活用が期待されます。