Google 、オープンウェイトの軽量 AI モデル「 Gemma 3n 」正式版をリリース

投稿者:

Google は 2025 年 6 月 26 日、新しいオープン AI モデル「 Gemma 3n 」ファミリーの正式版をリリースしました。このモデルは、スマートフォンやタブレット、ノート PC などのモバイル・エッジデバイス向けに最適化された軽量マルチモーダル AI モデルです。

Gemma 3n は、 E2B (実効パラメータ 2B )と E4B (実効パラメータ 4B )の 2 つのバージョンを提供しています。実際のパラメータ数はそれぞれ 5B および 8B ですが、独自の「 Per-Layer Embeddings ( PLE )」技術により、メモリ使用量は E2B で 2GB 、 E4B で 3GB に抑えられています。これにより、低スペックのデバイスでも高性能な AI 機能を利用できるようになります。

最大の特徴は、画像、音声、動画、テキストを入力として受け取り、テキスト出力が可能なマルチモーダル対応です。音声処理には Google の Universal Speech Model ( USM )を採用し、自動音声認識や音声翻訳をデバイス上で実現します。ビジョン処理には MobileNet-V5 を採用し、最大 60FPS のビデオ解析も可能です。

技術的には「 MatFormer 」という新しいアーキテクチャを採用しています。これは「マトリョーシカ型トランスフォーマー」と呼ばれる構造で、大きなモデルの中に小さなサブモデルを内包し、デバイスや用途に応じて柔軟に性能を調整できます。 Mix-n-Match 機能により、 2B から 4B の間でカスタムサイズのモデルを生成することも可能です。

プライバシー面でも優れており、インターネット接続不要で完全にデバイス上で動作するため、ユーザーデータをクラウドに送信せずに処理できます。これにより、プライバシー保護や遠隔地での利用に適しています。また、 140 以上の言語でテキスト処理が可能で、 35 言語のマルチモーダル理解をサポートしています。

性能面では、 E4B モデルが LMArena で 1303 のスコアを記録し、 10B 未満のモデルとして初めて 1300 超えを達成しました。これは、従来はクラウド専用の大規模モデルでしか得られなかった性能を、エッジデバイスでも実現したことを意味します。

開発者は Google AI Studio 、 Hugging Face 、 Kaggle などからすぐに試すことができ、独自のアプリやサービスに組み込むことが可能です。オープンウェイトで提供されているため、商用利用も自由に行えます。

Google は Gemma 3n のオフライン機能を活用した社会的インパクトのあるアプリケーション開発を奨励するコンテスト「 Gemma 3n Impact Challenge 」も開催しており、賞金総額 15 万ドル(約 2,170 万円)が用意されています。

このリリースは、クラウドに依存せず高性能な AI をエッジデバイスで実現することで、教育、医療、リアルタイム翻訳など幅広い分野での AI 活用を促進する Google の「 AI の民主化」戦略の一環として注目されています。