中 Baidu 、最大 4240 億パラメータの「 ERNIE 4.5 」をオープンソース化

投稿者:

中国の大手 AI 企業 Baidu (百度)は 2025 年 6 月 30 日、最新の大規模マルチモーダル AI モデル「 ERNIE 4.5 」ファミリーの 10 種類のバージョンをオープンソース化しました。これには総パラメータ数 4240 億( 424B )のマルチモーダルモデルも含まれており、 2024 年 12 月にリリースされた DeepSeek V3 ( 671B パラメータ)よりも半分以下のサイズでありながら、多くの主要ベンチマークで上回る性能を示しています。

ERNIE 4.5 の最大の特徴は、 0.3B の軽量モデルから最大 424B パラメータの超大型モデルまで、幅広いニーズに対応できる豊富なラインナップです。 Mixture-of-Experts ( MoE )アーキテクチャを採用することで、効率的な計算と高い性能を両立させています。

技術面では、テキスト・画像・音声・動画など複数のデータ形式を同時に理解・生成できるマルチモーダル対応が大きな強みです。特に「マルチモーダル異種 MoE 事前学習」という独自の手法により、各データ形式の特徴を損なうことなく、相互に強化しながら学習できるよう設計されています。

性能面では、 ERNIE-4.5-300B-A47B-Base モデルが、 DeepSeek-V3-671B-A37B-Base (約 2 倍のパラメータ数)を 28 の主要ベンチマーク中 22 で上回ったと報告されています。特に中国語処理、マルチモーダル推論、数学的問題解決で強みを発揮しており、ドキュメント分析では 93.1 点という高いスコアを記録しています。

一部のモデルでは「思考モード」と「非思考モード」を切り替えることができ、思考モードでは MathVista や MMMU などのベンチマークで優れた推論能力を発揮します。

Baidu はこれまでクローズドソースで AI モデルを開発してきましたが、今回 Apache 2.0 ライセンスで完全オープンソース化に踏み切りました。これは DeepSeek や Alibaba の Qwen など、中国企業のオープンソース化の流れに対応した戦略転換です。 CEO の Robin Li 氏は「世界中の開発者が高コストやロックインなしで強力な AI アプリを構築できることを目指す」とコメントしています。

開発者向けには、ファインチューニングやデプロイを支援する「 ERNIEKit 」「 FastDeploy 」も同時公開されており、 PyTorch 互換の形式も提供されています。 Hugging Face 、 GitHub 、 Baidu の PaddlePaddle エコシステムを通じて利用でき、研究および商用利用の両方に対応しています。

コスト面でも競争力があり、 API やクラウド経由での利用価格は OpenAI のモデルより大幅に安く、 100 万トークンあたり入力 0.55 ドル(約 80 円)、出力 2.20 ドル(約 318 円)という低価格を実現しています。(*DeepSeek R1と同等レベル)