Google DeepMind が 2025 年 9 月 3 日、スマートフォンやノートパソコンで動作する軽量 AI モデル「 EmbeddingGemma 」をオープンソースで無料公開しました。このモデルは、インターネットに接続しなくても 100 以上の言語でテキストの意味を理解し、検索や文書分析を行える画期的な技術です。
EmbeddingGemma は「埋め込みモデル(Embedding Model)」と呼ばれる種類の AI で、文章や単語を数値データに変換してコンピューターが意味を理解できるようにします。これまでこうした技術は高性能なサーバーが必要でしたが、Google は約 3 億(0.3B)パラメータという小さなサイズに圧縮し、一般的なデバイスでも快適に動作するよう改良しました。
最大の特徴は、完全にオフラインで動作することです。ユーザーのデータがインターネット上に送信されることがないため、プライバシーを重視するアプリケーションに最適です。わずか 200MB 未満のメモリで動作し、2,000 トークン程度の入力を一度に処理できます。
この技術は特に「 RAG 」と呼ばれる仕組みで威力を発揮します。RAG は AI が質問に答える際、関連する文書を検索して参考にする技術です。例えば、ユーザーが「来月の会議について教えて」と質問すると、EmbeddingGemma がその質問の意味を理解し、手元にある文書の中から関連する情報を見つけ出してくれます。すべてデバイス内で処理されるため、機密文書も安全に扱えます。
多言語対応にも特徴があります。100 以上の言語で学習されているため、日本語で質問して英語の文書から回答を得ることも可能です。グローバル企業や多国籍チームでの活用に大きなメリットがあります。
性能面では、同規模のモデルとしては世界最高クラスの精度を達成しています。文章の意味的類似性を判断するベンチマークテストで、2 倍近いサイズのモデルを上回る結果を出しており、軽量ながら非常に優秀な性能を示しています。