音声生成・TTS/STS アーカイブ

2026年6月17日（水）

2026年6月17日音声生成・TTS/STS 音声認識・STT

Cartesia、音声合成「Sonic-3.5」と音声認識「Ink-2」を同時リリース

米スタンフォード大 AIラボからスピンアウトし、音声 AI を手がけるスタートアップの Cartesia は、テキスト読…

2026年5月9日（土）

2026年5月9日 OpenAI 音声生成・TTS/STS

OpenAI の新しい音声モデル3種発表ー推論・翻訳・文字起こしをリアルタイムで

OpenAI は 2026 年 5 月 7 日、音声対話に特化した API「 Realtime API 」向けに、3つの…

2026年4月28日（火）

2026年4月28日 xAI / SpaceX 音声生成・TTS/STS

xAI、音声AIエージェント「Grok Voice Think Fast 1.0」を発表—企業向けに API 提供開始

イーロン・マスク氏が創業した xAI は 2026 年 4 月 23 日、新しい音声 AI エージェント「Grok Vo…

2026年4月18日（土）

2026年4月18日 Google / DeepMind 音声生成・TTS/STS

Google、テキスト読み上げモデル「Gemini 3.1 Flash TTS」をリリース

Google DeepMind は 2026 年 4 月 15 日、新しいテキスト読み上げモデル「 Gemini 3.1…

2026年4月10日（金）

2026年4月10日 AI Chat Google / DeepMind

Google の新音声 AI モデル「 Gemini 3.1 Flash Live 」が正式発表——主な改善点と提供形態

Google は 2026 年 3 月 27 日、音声によるリアルタイム会話に特化した AI モデル「 Gemini 3…

2026年4月10日 Mistral フランス

Mistral、テキスト読み上げモデル「Voxtral TTS」を公開

フランスの AI 企業 Mistral は 2026 年 3 月 26 日、同社初となるテキスト読み上げモデル「Voxt…

2025年12月15日（月）

2025年12月15日 ElevenLabs Meta

MetaがElevenLabsと提携、InstagramとHorizonで音声AIを本格導入へ

2025年 12 月、AI 音声合成技術のリーディングカンパニーである ElevenLabs は、ソーシャルメディア大手…

2025年11月14日（金）

2025年11月14日 ElevenLabs 音声生成・TTS/STS

AI音声大手ElevenLabs、有名人音声マーケットプレイス「Iconic Voice」発表

AI 音声技術を手がける ElevenLabs は 11 月 11 日、初開催の ElevenLabs Summit で…

2025年9月7日（日）

2025年9月7日 Tencent 中国

Tencent が動画向け AI 効果音生成「 HunyuanVideo-Foley 」をオープンソース化

中国 IT 大手の Tencent は 2025 年 8 月 28 日、動画に自動でプロフェッショナル品質の効果音を生成…

2025年9月7日 OpenAI 音声生成・TTS/STS

OpenAI、Realtime APIを正式公開：音声対話モデル「gpt-realtime」

OpenAI は、ベータ版で提供されていた Realtime API を正式に一般公開し、新たな音声対話モデル「 gpt…

2025年9月6日（土）

2025年9月6日 AI Chat Microsoft

Microsoft が独自 AI モデル「MAI-Voice-1」と「MAI-1-preview」を発表

Microsoft は 2025 年 8 月 28 日、独自開発 AI モデル「 MAI-Voice-1 」と「 MAI…

2025年8月27日（水）

2025年8月27日 Microsoft 音声生成・TTS/STS

Microsoft 、最大 90 分の長時間音声生成が可能な「 VibeVoice 」をオープンソースで公開

Microsoft は、長文オーディオや複数話者の会話音声を最大 90 分間生成できるオープンソースの「Text-to-…

1 2 3 »