2026年5月9日 OpenAI 音声生成・TTS/STS OpenAI の新しい音声モデル3種発表ー推論・翻訳・文字起こしをリアルタイムで OpenAI は 2026 年 5 月 7 日、音声対話に特化した API「 Realtime API 」向けに、3つの… 続きを読む »
2026年4月28日 xAI / SpaceX 音声生成・TTS/STS xAI、音声AIエージェント「Grok Voice Think Fast 1.0」を発表—企業向けに API 提供開始 イーロン・マスク氏が創業した xAI は 2026 年 4 月 23 日、新しい音声 AI エージェント「Grok Vo… 続きを読む »
2026年4月18日 Google / DeepMind 音声生成・TTS/STS Google、テキスト読み上げモデル「Gemini 3.1 Flash TTS」をリリース Google DeepMind は 2026 年 4 月 15 日、新しいテキスト読み上げモデル「 Gemini 3.1… 続きを読む »
2026年4月10日 AI Chat Google / DeepMind Google の新音声 AI モデル「 Gemini 3.1 Flash Live 」が正式発表——主な改善点と提供形態 Google は 2026 年 3 月 27 日、音声によるリアルタイム会話に特化した AI モデル「 Gemini 3… 続きを読む »
2026年4月10日 Mistral フランス Mistral、テキスト読み上げモデル「Voxtral TTS」を公開 フランスの AI 企業 Mistral は 2026 年 3 月 26 日、同社初となるテキスト読み上げモデル「Voxt… 続きを読む »
2025年12月15日 ElevenLabs Meta MetaがElevenLabsと提携、InstagramとHorizonで音声AIを本格導入へ 2025年 12 月、AI 音声合成技術のリーディングカンパニーである ElevenLabs は、ソーシャルメディア大手… 続きを読む »
2025年11月14日 ElevenLabs 音声生成・TTS/STS AI音声大手ElevenLabs、有名人音声マーケットプレイス「Iconic Voice」発表 AI 音声技術を手がける ElevenLabs は 11 月 11 日、初開催の ElevenLabs Summit で… 続きを読む »
2025年9月7日 Tencent 中国 Tencent が動画向け AI 効果音生成「 HunyuanVideo-Foley 」をオープンソース化 中国 IT 大手の Tencent は 2025 年 8 月 28 日、動画に自動でプロフェッショナル品質の効果音を生成… 続きを読む »
2025年9月7日 OpenAI 音声生成・TTS/STS OpenAI、Realtime APIを正式公開:音声対話モデル「gpt-realtime」 OpenAI は、ベータ版で提供されていた Realtime API を正式に一般公開し、新たな音声対話モデル「 gpt… 続きを読む »
2025年9月6日 AI Chat Microsoft Microsoft が独自 AI モデル「MAI-Voice-1」と「MAI-1-preview」を発表 Microsoft は 2025 年 8 月 28 日、独自開発 AI モデル「 MAI-Voice-1 」と「 MAI… 続きを読む »
2025年8月27日 Microsoft 音声生成・TTS/STS Microsoft 、最大 90 分の長時間音声生成が可能な「 VibeVoice 」をオープンソースで公開 Microsoft は、長文オーディオや複数話者の会話音声を最大 90 分間生成できるオープンソースの「Text-to-… 続きを読む »
2025年8月9日 MiniMax 中国 中 MiniMax が 40 言語対応の音声 AI 「 Speech 2.5 」をリリース 中国の AI スタートアップ MiniMax は 2025 年 8 月 7 日、新世代の音声 AI 「 Speech 2… 続きを読む »