Hume AIは最近、同社の感情理解のための音声インターフェース技術EVI 2(Empathic Voice Interface 2)と、AnthropicのClaude 3.5 SonnetおよびHaikuを組み合わせた新しいAIアシスタントアプリを発表しました。
EVI 2は、声のトーンや感情的なニュアンスを理解し、共感的な応答が可能な音声インターフェースです。1秒以下で応答する高速な応答性を持ち、ユーザーの声のトーンを理解して適切に反応できます。また、個々のユーザーの好みに合わせて声や性格をカスタマイズ可能で、多言語対応により様々な話し方やアクセントを再現できるのが特徴です。
一方、Claude 3.5 Sonnetはプログラミングや問題解決に優れた性能を発揮し、複雑な推論が可能なAIモデル、Claude 3.5 Haikuは高速な応答性と効率性に最適化された新しいモデルで、インタラクティブなチャットボットに適しています。
Humeは独自のLLMを使用せず、Anthropicのこれらのモデルをバックエンドのチャットエンジンとして採用することで、感情理解という独自の強みに集中し、効率的な開発戦略に舵を切ったようです。
Humeの感情エンジンはOpenAIですでに実装されている「Advanced Voice Mode」よりも優れていると思えるものの、独自LLMを開発し続けるのは開発費の負担等で荷が重すぎるように思えます。一方Anthropicも未だOpenAIに対抗した感情表現豊かな音声インターフェイスはないので、両者のタッグは魅力的に見えます。今後の展開に注目したいと思います。