イベント概要
Google 本社近くの「Shoreline Amphitheatre(ショアライン・アンフィシアター)」で 5月20〜21日の 2日間にわたり開催された Google I/O 2025 は、AI を中心とした大規模な進化と新機能の発表が相次ぎ、同社の AI 戦略がさらに加速していることを強く印象づけるイベントとなりました。Gemini モデルを中心とした数多くの革新的な発表が行われ、検索体験から生成 AI 、ハードウェア統合まで、AI があらゆるサービスの中核に据えられる戦略が明確に示されました。
Gemini 2.5 ファミリーの大幅進化
Google の主力 AI モデルである Gemini 2.5 シリーズが大幅にアップデートされ、性能と効率性が飛躍的に向上しました。Gemini 2.5 Pro は、従来モデルよりも推論力・理解力が大幅に向上し、ELO レーティングで 300 ポイント以上の飛躍を記録しています。
特に注目すべきは「 Deep Think 」モードです。このモードにより、AI が応答前に複数の仮説を検討し、より理論的かつ精度の高い回答を実現できます。数学、コーディング、マルチモーダルタスクでの問題解決能力が向上し、スケッチから完全なアプリケーションを生成するデモも披露されました。
Gemini 2.5 Flash は、推論のオン・オフが可能なハイブリッド設計を採用し、コスト・パフォーマンス・遅延のバランスを最適化しています。トークン消費も 20 ~ 30% 削減され、マルチモーダル対応やコーディング力も強化されています。また、24 言語での音声対話が可能で、会話の流れを理解し、雑音を無視する能力も向上しました。
現在、Gemini アプリは月間 4 億人以上のアクティブユーザーを誇り、Vertex AI での利用は 40 倍に増加、処理トークン数は昨年比で 50 倍( 9.7 兆から 480 兆)に成長しています。
Project Astra と Gemini Live の統合
Project Astra は、カメラやスクリーン共有を通じてリアルタイムで周囲の環境を理解し、行動を起こす次世代 AI アシスタントとして進化しました。最も注目すべきは、Gemini Live が Android および iOS ユーザー向けに無料で提供開始されたことです。
この機能により、ユーザーはカメラやスクリーン共有を通じて、AI が見ているものをリアルタイムで分析し、対話できるようになります。例えば、自転車の修理中にメールから仕様を確認したり、修理情報を検索したり、地元のショップに電話をかけるサポートなどが可能になります。
さらに、Google Maps でのナビゲーション、Google Calendar でのイベント作成、Google Tasks での ToDoリスト作成など、他の Google アプリとの深い統合も予定されており、より包括的な AI アシスタント体験を提供します。
AI Mode による検索体験の刷新
Google 検索に新たに導入された「 AI Mode 」は、複雑な問い合わせに対応するチャットボット風のインターフェースを提供し、従来のウェブ検索を大きく進歩させます。まずは米国ユーザー向けに一般公開が開始され、Labs 経由で即時アクセス可能になりました。
「 Deep Search 」機能は、より詳細な調査が必要な質問に対応し、PDF や画像のアップロードをサポートします。近日中には Google Drive や Gmail のドキュメントを入力ソースとして利用可能になる予定です。また、Gmail の過去の検索やデータを活用して、より個人化された検索結果を提供します。
ショッピング機能では、服の「バーチャル試着」や価格追跡機能が追加され、リアルタイムで商品が更新されます。スポーツや金融データのクエリに対しては、AI 生成のグラフやチャートをカスタム作成する機能も提供されます。
生成系 AI ツールの大幅強化
Google は、画像・動画・音楽生成における新しいモデルを発表し、クリエイティブ分野での AI 活用を大幅に強化しました。
Imagen 4 は、テキストから高精細な画像を生成するモデルで、布地や水滴、動物の毛などの細部描写が向上し、2K 解像度まで対応しています。フォトリアリスティックおよび抽象的なスタイルをサポートし、Gemini アプリで即時利用可能です。
Veo 3 は動画生成モデルで、流動的なモーションとネイティブサウンドトラック(効果音、背景音、対話)を生成可能です。デモでは映画のサイレント時代を終わらせたと称され、対話や効果音付きの動画生成が披露されました。
新たに発表された Flow は、Veo 3 と Imagen 4 を統合した AI 動画作成ツールで、テキストや画像から 8 秒の動画クリップを生成し、シーン構築ツールで長編動画の作成も可能です。
音楽分野では、Lyria RealTime がインタラクティブな音楽生成モデルとして登場し、リアルタイムでの音楽作成と操作を可能にしています。
Google Beam と次世代コミュニケーション
AI を活用した 3D ビデオ通話プラットフォーム「 Google Beam 」(旧 Project Starline )が発表されました。6 台のカメラと AI を用いて 2D ビデオをリアルタイムで 3D に変換し、頭の動きをミリ単位で追跡して 60fps で自然な対話体験を提供します。
HP と提携し、2025 年後半に企業向けに初のデバイスを展開予定で、Zoom との連携も計画されています。また、Google Meet では音声と表情をリアルタイムで翻訳する機能が追加され、英語・スペイン語のベータ版が Google AI Pro/Ultra ユーザー向けに提供開始されました。
Android XR と AI 統合
Android XR プラットフォームは、スマートグラスやヘッドセット向けの新しい OS として紹介され、Gemini の統合が強調されました。ライブデモでは、スマートグラスでのメッセージ送信、ナビゲーション、リアルタイム翻訳(字幕表示)が披露されました。
Gentle Monster 、Warby Parker 、Samsung 、XREAL と協力し、2026 年以降の商用化を目指しています。Project Astra の活用により、ユーザーの視点から情報を取得し、行動を支援する機能が組み込まれ、日常のタスクを効率化します。
開発者向け AI ツールと Workspace 統合
開発者向けには、多数の新しいツールや API が発表されました。Stitch は自然言語や画像プロンプトから UI デザインとフロントエンドコード( HTML/CSS )を生成し、生成されたコードは Figma や CSS へのエクスポートも可能です。Jules は非同期コーディングエージェントで、GitHub リポジトリと連携してバージョンアップやバグ修正を自動化します。
Google Workspace では、Gmail に Smart Replies 機能が追加され、過去のメールやファイルを参照してユーザーの文体やトーンに合わせたパーソナライズされた返信を提案します。Canvas では、テキストからインフォグラフィック、ウェブページ、クイズ、ポッドキャスト形式のオーディオ概要を生成する新メニューが 45 言語に対応して追加されました。
AI 倫理と透明性への取り組み
AI 生成コンテンツの透明性を高める取り組みも発表されました。SynthID Detector は AI 生成コンテンツを識別する検証ポータルで、すでに 100 億件以上のコンテンツに透かしが適用されています。Thought Summaries 機能では、Gemini 2.5 モデルで思考プロセスを透明化し、開発者がモデルの応答を管理可能にしています。
Google I/O 2025 は、Gemini 2.5 を中心とした AI モデルの性能向上、Project Astra によるリアルタイム対話機能の拡張、検索や動画生成、コミュニケーションにおける AI の深い統合に焦点を当てたイベントでした。Google の「 AI ファースト」戦略が明確に示され、AI が日常生活やクリエイティブ分野でどのように役立つかを具体的に提示した革新的なイベントとなりました。