仏 Mistral AI が新型コーディング特化型 AI モデル「 Devstral 」をリリース、オープンソースで SWE-Bench 最高性能を達成

投稿者:

フランスの AI スタートアップ Mistral AI が、 All Hands AI と共同開発した新しいオープンソースのコーディング特化型 AI モデル「 Devstral 」を 2025 年 5 月 21 日に発表しました。この AI は、従来の大規模モデルを上回る性能を発揮しながら、一般的なハードウェアのローカル上で実行できる画期的なモデルとして注目されています。

Devstral は、約 236 億パラメータという比較的コンパクトなサイズながら、ソフトウェア開発タスクにおいて驚くべき性能を示しています。特に注目すべきは、実際の GitHub の Issue 解決に特化した「エージェント型」のアプローチを採用している点です。単純なコード生成や補完を超えて、大規模なコードベース全体の文脈を理解し、複数ファイルの編集やバグ検出など、実践的な開発業務を自律的に行うことができます。

性能面では、ソフトウェアエンジニアリング分野の権威あるベンチマーク「 SWE-Bench Verified 」で 46.8 %のスコアを記録し、これまでのオープンソース最高性能を更新しました。この結果は GPT-4.1-mini より 20 ポイント以上高く、 DeepSeek-V3 や Qwen3 といった遥かに大規模なモデルも上回っています。また、 Claude 3.5 Haiku と同等以上の性能を発揮しており、商用モデルに匹敵する実力を持っています。

実用性の高さも Devstral の大きな特徴です。 RTX 4090 搭載 PC や 32GB RAM の Mac など、一般的なハードウェア環境でローカル実行が可能で、企業が情報漏洩リスクを抑えながら自社環境でコード解析・生成を行えます。最大 128k トークンの長大なコンテキストウィンドウを持ち、広範なコードベース全体を一度に処理できる点も実務での活用に適しています。

ライセンス面でも大きな進歩があります。 Apache 2.0 ライセンスで公開されており、商用利用や改変、再配布が自由に行えます。これは Mistral が以前リリースした「 Codestral 」が商用利用に制限があったのと対照的で、企業での導入ハードルを大幅に下げています。

利用方法も多様で、 Hugging Face 、 Ollama 、 Kaggle 、 Unsloth などでモデルが公開されている他、 Mistral のプラットフォーム経由で API 利用も可能です。 API 利用料金は入力 100 万トークンあたり 0.10 ドル(約 15 円)、出力 100 万トークンあたり 0.30 ドル(約 45 円)と競争力のある価格設定になっています。

Devstral の登場は、 AI コーディング支援の分野に大きな変化をもたらす可能性があります。 OpenAI の Codex や Microsoft の GitHub Copilot などが市場を牽引する中、オープンソースでローカル実行可能な高性能モデルの選択肢が生まれたことで、開発者や企業の選択の幅が大きく広がります。特に、プライベートなコードベースでの作業やベンダーロックインを避けたい組織にとって、 Devstral は魅力的な選択肢となるでしょう。