中国 IT 大手の Tencent は 2025 年 8 月 28 日、動画に自動でプロフェッショナル品質の効果音を生成する AI モデル「 HunyuanVideo-Foley 」をオープンソースで公開しました。このモ
続きを読む
中国 IT 大手の Tencent は 2025 年 8 月 28 日、動画に自動でプロフェッショナル品質の効果音を生成する AI モデル「 HunyuanVideo-Foley 」をオープンソースで公開しました。このモ
続きを読むOpenAI は、ベータ版で提供されていた Realtime API を正式に一般公開し、新たな音声対話モデル「 gpt-realtime 」の提供を開始しました。この発表は 2025 年 8 月 28 日に行われ、開発
続きを読むMicrosoft は 2025 年 8 月 28 日、独自開発 AI モデル「 MAI-Voice-1 」と「 MAI-1-preview 」を発表し、これまで OpenAI 技術への依存が続いていた関係性に新たな変化
続きを読むMicrosoft は、長文オーディオや複数話者の会話音声を最大 90 分間生成できるオープンソースの「Text-to-Speach( TTS )」モデル「 VibeVoice 」をリリースしました。従来の TTS モデ
続きを読む中国の AI スタートアップ MiniMax は 2025 年 8 月 7 日、新世代の音声 AI 「 Speech 2.5 」をリリースしました。(デモはこちら)このモデルは 40 言語に対応し、アクセント(訛り)、年
続きを読むHume AI が 2025 年 7 月 17 日、次世代の Speech-to-Speech モデル「 EVI 3 ( Empathic Voice Interface 3 )」を API 経由でリリースしました。この
続きを読むAI 音声合成スタートアップの ElevenLabs は、新しいテキスト読み上げ( TTS )モデル「 Eleven v3 (アルファ版)」を発表しました。同社は「これまでで最も表現力豊かなモデル」と位置づけており、従来
続きを読む韓国のスタートアップ Nari Labs が 2025 年 4 月、画期的なオープンソースの音声合成(Text-to-Speech、TTS)モデル「Dia」をリリースしました。この 1.6 億パラメータのモデルは、Ele
続きを読むGoogle が 2025 年 4 月 14 日に発表した「DolphinGemma」は、イルカの音声通信を解析し、生成するために設計された新しい AI モデルです。このプロジェクトは、ジョージア工科大学およびワイルド・
続きを読むAmazon は、新たな AI 音声モデル「Nova Sonic」と、動画生成モデル「Nova Reels 1.1」を発表しました。Nova Sonic は音声認識と音声生成を一体化した「スピーチ・トゥ・スピーチ」モデル
続きを読む2021年に創業した中国・上海に本拠を置く AI スタートアップの MiniMax が「 Speech-02 」をリリースしました。Speech-02 はテキストから音声への変換( TTS: Text-to-Speech
続きを読むOpenAI は 2025 年 3 月 20 日、次世代の音声モデルを API ベースでリリースしました。この新モデルは、テキストから音声への変換(Text-to-Speech, TTS)および音声からテキストへの変換(
続きを読む