- 総合評価:★★★★☆
- 音声認識の精度:★★★★★
AIの文字起こしをしてくれるサービス「Assembly AI」を使ってみました。
AssemblyAIは、最先端の技術を使用して開発された音声認識APIサービスです。業界トップレベルの認識精度を誇り、最新のベンチマークでは、Word Error Rate(WER)が4%未満という優れた性能を示しています。
基本的にはAPIのサービスですので、開発者がアプリケーションに簡単に音声認識機能を組み込めるように設計されています。本来はAPIで使用するシステムですが、Playgroundでは試してみることができます。現在、Playgroundはユーザー登録をすれば無料で使用可能です。
Playgroundでは、ローカルの音声ファイルやビデオファイルをアップロードしたり、YouTubeのリンクを直接入力して分析することもできます。
実際に試してみたところ、会議の議事録としても使えるレベルの高い精度を確認できました。英語の場合は、内容を要約したり、フィラーワード(間投詞)を削除するなど、多彩な機能も提供されています。
筆者独断の評価は星4つです。認識精度としては非常に高いものがあることを確認できました。ただ、日本語では認識以外の機能はまだ使えないことや、基本的にAPIでの提供でWebサービスは提供されていないことなどから、星を1つ減じました。今後の機能強化とWEB版の公開などに期待したいと思います。