Google、Geminiに「Canvas」と「Audio Overview」機能を追加

投稿者:

Google は最近、「 Gemini 」に「 Canvas 」と「 Audio Overviews 」の機能を追加しました。これらの機能は、ユーザーのコンテンツ作成やコーディング作業の効率を大幅に向上させることを目的としています。

「 Canvas 」は、Gemini 内に実装されたインタラクティブなコラボレーションスペースで、文書編集やコード開発をリアルタイムで行える環境を提供します。ユーザーは Gemini と協力してテキストのドラフトを作成し、「もっと簡潔に」「もっと堅い表現で」といった指示を出すことで、AI が即座に提案や修正を行います。またプログラミングコードの開発者にとっては、HTML や React などのコードを生成し、その場でプレビューを確認できるようになります。OpenAI の ChatGPT などでは同様の機能がすでに昨年末にリリースされていて好評を博していましたが、Google もようやく追いついてきたと言えます。

一方、「 Audio Overviews 」は、Google お得意のポッドキャスト生成機能で、文書やスライド、レポートをポッドキャスト形式の音声コンテンツに変換する機能です。これは、アップロードしたファイルをもとに、2 人の AI ホストが対話形式で内容を要約し、トピックを解説します。これにより、テキストを読む時間がない場合でも、移動中や作業中に情報を聴くことができるようになります。Google の Notebook LM では昨年 9 月からこの機能が実装されていましたが、複雑なコンテンツがわかりやすくなると好評でした。その機能を Gemini 本体に実装したことになります。

Canvas については、前述の通り、OpenAI の ChatGPT Canvas や Anthropic の Artifacts など、競合他社でもそっくりの機能がありますが、Google は Google 内の他のツール(特に Google Docs)との統合を強みとしています。

これらの機能は 2025 年 3 月 18 日から、Gemini および Gemini Advanced 会員向けにグローバル展開が始まっています。Canvas はすべての言語で利用可能で、今後数週間以内にモバイル版も提供される予定です。一方、Audio Overviews は当初英語のみの対応ですが、今後さらに多くの言語が追加される見込みです。


筆者の視点:Google は、ようやくライバルと同等の機能を Gemini に追加してきました。Gemini はベンチマーク上では高い性能を示しているものの、実際の使用感ではやや見劣りする点もあります。たとえば、生成される日本語が少し不自然だったり、少しでも政治的な話題に触れると回答を拒否する傾向があったりと、使い勝手の悪さが目立ちます。

とはいえ、Google の強みはやはり、Gmail、Docs、スプレッドシートといった自社のサービス群と連携できる点にあります。このエコシステムとの連携という強みを活かすためにも、開発スピードをさらに加速させ、少なくともライバルに見劣りしない使いやすさを実現してほしいと期待しています。