Google DeepMind と NVIDIA は 2026 年 6 月 10 日、新しいアーキテクチャを採用した AI 言語モデル「DiffusionGemma」を発表しました。無償かつ商用利用も可能なオープンライセンスで公開されており、企業が自社サービスへ組み込む際のハードルも低く設定されています。
最大の特徴は、テキストを生成する仕組みそのものの刷新です。従来の AI モデルは文章を先頭から 1 文字ずつ順番に出力していましたが、DiffusionGemma は画像生成 AI に近い「拡散」という手法を採用し、大きなテキストのかたまりを一度に並列処理します。この仕組みにより、高性能なサーバー向け GPU「NVIDIA H100」では毎秒 1,000 トークン超、一般向けの「GeForce RTX 5090」でも毎秒 700 トークン超を達成しており、従来モデルと比べて最大 4 倍の速度で文章を生成できます。
ビジネス利用の観点で注目すべき点は、動作に必要なハードウェアのハードルの低さです。モデル全体のパラメータ数は 26B(260 億)と大規模ですが、実際の処理時に使われるのはそのうちの一部に過ぎず、適切な圧縮処理を施すことで一般向けの高性能 GPU 上でもクラウドを使わずローカルで動かせます。テキストだけでなく画像や動画も入力として扱えるほか、140 以上の言語に対応しているため、グローバルなサービス展開にも応用しやすい設計です。
開発者向けの環境整備も初日から整っており、広く使われている各種フレームワークやクラウドサービスとの連携にもすぐに対応しています。社内ツールの構築からサービスへの組み込みまで、比較的スムーズに着手できる状況です。
一方で、精度面での課題も率直に示されています。標準的な品質評価では同社の通常モデル「Gemma 4」を下回っており、Google 自身もあくまで「実験的なリリース」と位置づけています。チャット応答やコード補完など「とにかく速さが重要」な場面には向いていますが、出力の正確さや品質を最優先する業務には現時点では適していません。
大規模な言語モデルに拡散技術を組み合わせ、オープンライセンスで公開したのは業界初の事例です。AI 生成の主流であった逐次処理型のアーキテクチャに対するオルタナティブとして、今後の動向が注目されます。
