Hume AIが「Voice Control」を発表 – AI音声の感情を自在にカスタマイズ

投稿者:

米ニューヨークに本社を置くHume AIが、AIの音声を細かく調整できる新しい機能「Voice Control」を開発しました。

この機能を使うと、ミキサーのつまみを回すように、声の高さや速さ、感情などを変えられます。例えば、「明るい声」「落ち着きのある声」「自信に満ちた声」など、10種類以上の特徴を自由に調整できます。

また、専門的な知識がなくても簡単に操作可能です。実際にアウトプットの音声を聞きながら調整できるので、最終的にイメージ通りの声を作ることができます。

Voice Controlを使用して調整した音声は、様々な場面で使用されることが想定されています。例えば、お店の案内をするAIの音声を親しみやすい声にしたり、オンライン授業で使うAIの音声を先生のように信頼できる声にしたりすることができるようになります。

Voice Controlは、Hume AIの共同創設者であり、元Google DeepMind研究者のAlan Cowen氏が、感情科学と大量の音声データを活用して開発したモデルを基盤としています。そのため、AIの音声でありながら、まるで人間のように感情を表現することができます。

現在はまだ開発段階ですが、登録をすれば誰でもHume AIのウェブサイトで試すことができます。将来的には、さらに多くの調整項目が追加される予定です。

Hume AIは立ち上げ当初からAIの感情表現に特化したプロダクト作りをしています。このアプローチのまま会社をどのように存続させていくのか、興味深く見ています。一分野に特化した技術なだけに、どこかのタイミングでより大きな資本で基盤モデルを開発している会社に統合されていくのではないかと思います。