Microsoft が独自 AI モデル「MAI-Voice-1」と「MAI-1-preview」を発表

投稿者:

Microsoft は 2025 年 8 月 28 日、独自開発 AI モデル「 MAI-Voice-1 」と「 MAI-1-preview 」を発表し、これまで OpenAI 技術への依存が続いていた関係性に新たな変化をもたらしています。

「 MAI-Voice-1 」は、極めて自然で高表現力な音声を高速生成できる音声 AI モデルです。このモデルは既に Copilot Daily や Podcast、「 Copilot Labs 」で活用されており、シングル・マルチスピーカー両方に対応可能です。このモデルの特徴は、1 分間の音声を GPU 1 枚で 1 秒未満に生成できる効率性にあります。この処理速度と効率性は、音声生成 AI の実用化において大きな優位性を提供します。

一方「 MAI-1-preview 」は、 Microsoft AI ( MAI )が初めてエンド・ツー・エンドで事実上自社訓練した Foundation Model で、ミクスチャー・オブ・エキスパート( MoE )方式を採用しています。この学習には、およそ 15,000 台の NVIDIA H100 GPU が使用されました。複雑な指示にも従い、日常的な問いに有用な回答をする強力な能力を持つとされており、まずは LMArena という評価プラットフォームや、選ばれたテスター・ API 利用者向けに提供されています。今後、 Copilot 内のテキスト系機能にも順次反映される予定です。

Microsoft は長年にわたり OpenAI モデルに依存してきましたが、パートナーシップの不安定化を受けて自社 AI の開発を進めています。今回の 2 モデルは、「あらゆる人と企業のための信頼性・個性・専門性に優れた AI プラットフォームを目指す」とする Microsoft AI の新戦略の第一歩です。

今後は、用途別の特化 AI モデルや大規模インフラ(次世代 GB200 クラスタなど)を武器に、さらなる開発・提供拡大を予定しています。 Microsoft が自社 AI の基盤技術を持つことで、今後の AI サービスや戦略において、より柔軟かつ独立した展開を加速させていくことが期待されます。