Hume AI、感情インテリジェンスに特化した音声対話AI「EVI 2」を発表

投稿者:

ニューヨークに本社を置くHume AIが、最新の音声対話AIモデル「Empathic Voice Interface 2 (EVI 2)」を発表しました。EVI 2は、人間らしい自然な会話を可能にする画期的な技術を搭載し、特に感情インテリジェンスに特化して訓練されています。

今回アップデートされたEVI 2の主な特徴は、音声と言語を同時に処理し、ユーザーの感情的な文脈を理解して共感的な応答を生成できること、低遅延(平均約500ミリ秒)で応答が可能で、EVI 1と比べて40%の速度向上を実現していること、様々な性格、アクセント、話し方のスタイルを模倣できること、そして多言語対応の能力を備えていることです。

感情インテリジェンスの面では、ユーザーの声のトーンを理解し、それに合わせて適切な言葉遣いや声のトーンで応答します。また、ユーザーの表現に反応し、満足度を最大化するような言葉を選び、会話の中断タイミングを適切に判断し、中断された場合でも途中から再開できます。

開発者は、EVI 2の性別、鼻声の度合い、ピッチなどの音声特性をカスタマイズでき、特定のアプリケーションやユーザーに合わせた独自の音声を作成することが可能です。

現在、EVI 2はベータ版として一般に公開されており、Hume AIのアプリやAPIを通じて利用できます。今後は、信頼性の向上、言語サポートの拡大、より複雑な指示への対応能力の強化が予定されており、より大規模なモデルであるEVI-2-largeも近日中に発表される予定です。