AI 音声技術のリーディングカンパニー ElevenLabs は、新しい音声ファーストの AI アシスタント「11ai(イレブンエーアイ)」を正式にリリースしました。このアシスタントは、従来の「質問に答えるだけ」の音声 AI とは一線を画し、ユーザーの指示に基づいて実際にタスクを実行できる点が大きな特徴です。
11ai の最大の革新性は、アクション実行型の音声アシスタントとして設計されていることです。単なる会話や情報提供にとどまらず、ユーザーの声による指示で外部ツールと連携し、予定の追加、リサーチ、メッセージ送信、タスク管理などを自動で行います。例えば、「今日の予定を Google カレンダーに追加して」「Slack のエンジニアチャンネルの未読メッセージを要約して」「Perplexity で顧客の最新情報を調べて CRM に反映して」といった複数のアクションを、会話の流れの中でシームレスに実行できます。
技術的な核となるのは、Anthropic が提唱する Model Context Protocol ( MCP )の採用です。MCP は、AI アシスタントと外部ツールやデータソースを安全かつ標準化された方法で接続できるオープンプロトコルで、Salesforce 、HubSpot 、Gmail 、Zapier 、Slack 、Google Calendar 、Notion 、Linear 、Perplexity など多様なサービスと連携可能です。MCP 対応により、企業や開発者は自社内の専用ツールやサーバーとも連携でき、独自のワークフロー構築や自動化が容易になります。
パーソナライズ機能も充実しており、5,000 種類以上の音声から選択できるほか、自分自身の声をクローンしてアシスタントの声に設定することも可能です。70 以上の言語に対応し、自動言語認識機能も搭載されているため、グローバルな利用にも最適化されています。
さらに、音声とテキストの両方でやり取りできるマルチモーダル・インタラクションと、会話の文脈を維持しながら適切なレスポンスを返す Retrieval-Augmented Generation ( RAG )技術も搭載されています。これにより、より自然で文脈に沿った対話が可能になっています。
11ai は現在「アルファ版」として無料で公開されており、公式サイト(11.ai)でサインアップすることで誰でも試すことができます。利用者は声や言語、連携ツール、MCP サーバーなどを設定し、すぐに音声アシスタントとして利用可能です。今後はユーザーからのフィードバックをもとに、さらに多くの外部サービスとの連携やアクションの拡充、会話体験の向上が予定されています。
11ai は、従来の「話すだけ」の AI から一歩進み、「話すことで実際に行動する」次世代の音声アシスタントです。MCP による柔軟な外部連携とパーソナライズ性、多言語対応により、個人の生産性向上だけでなく、企業の業務効率化やグローバルなチームコラボレーションにも大きな可能性を持っています。