中国 DeepSeek が V3 モデルをアップデート、推論能力を向上

投稿者:

中国の AI スタートアップ DeepSeek が、V3 モデルのアップデート版「 DeepSeek-V3-0324 」をリリースしました。このモデルは 671B という巨大なパラメータサイズでありつつ、同時に高性能なパーソナルコンピュータ上でも動作可能なコンパクトな設計になっています。加えて、MIT ライセンスでオープンソースで公開されており、幅広い用途での利用が許可されている点が注目されています。

このアップデートは 2025 年 3 月 24 日に公開され、名称もリリース日に由来しています。既存の V3 モデル( 2024 年 12 月初公開)を基にした改良版で、「 Hugging Face 」上で誰でもアクセス可能となっています。今回のモデルは、推論能力やコーディング能力が向上し、業界標準のベンチマーク(数学の AIME 試験など)で以前のバージョンより優れた結果を示しています。

DeepSeek-V3 は 6710 億パラメータ( 671B )ですが、 Mixture of Experts( MoE )モデルを採用し、推論時にアクティブになるパラメータは 370 億( 37B )となります。この効率的な設計により、巨大なモデルでありながら計算負荷を抑えることができます。このため、671B というサイズは大規模ですが、 Apple の Mac Studio のような高性能な個人向けデバイスでも毎秒 20 トークンの速度で動作可能とされており、クラウド依存型のモデルと異なり、ローカルでの利用が現実的になっています。

初期のテストでは、数学やウェブ開発などのタスクで顕著な改善が見られ、 Claude や GPT-4o といった競合モデルに匹敵、あるいはそれを超える性能を発揮しているとの報告もあります。

また、今回オープンソースの配布ライセンス形態が、ユーザーにとってより自由度の高い MIT ライセンスに変更されました。これにより、開発者や企業は DeepSeek-V3-0324 を自由に活用し、カスタマイズや商用製品への統合が可能になっています。

DeepSeek は 2023 年に設立された比較的新しい企業で、中国のヘッジファンド High-Flyer の支援を受けています。創業者の梁文峰氏は、 2021 年から Nvidia の GPU を大量に確保し、 AI 開発に着手していました。今回のアップデートは、同社が昨年 12 月にリリースした V3 モデルや今年 1 月の R1 モデルに続くもので、中国の AI 技術が急速に進化していることを象徴しています。