フランスの Mistral AI は、エージェント型 AI やソフトウェアエンジニアリングタスク向けに特化した最新モデル「 Devstral Small 1.1 」と「 Devstral Medium 2507 」をリリースしました。コード生成能力を大幅に向上させた今回のアップデートは、開発者コミュニティから熱い視線を集めています。
両モデルのベンチマーク性能は目を見張るものがあります。オープンソースの Devstral Small 1.1 は、 SWE-Bench Verified で 53.6% のスコアを達成し、同サイズの他のオープンソースモデルを軽々と上回りました。上位モデルの Devstral Medium 2507 に至っては 61.6% という驚異的なスコアを記録し、 Gemini 2.5 Pro や GPT-4.1 といった有名な商用モデルをも上回る結果を出しています。
料金設定も開発者にとって嬉しいレベルです。 Devstral Small 1.1 は入力トークン 100 万あたり 0.1 ドル(約 15 円)、出力トークン 100 万あたり 0.3 ドル(約 45 円)で利用でき、 Devstral Medium 2507 は入力 0.4 ドル(約 60 円)、出力 2 ドル(約 298 円)となっています。精度の高いコード生成でデバッグ時間を短縮できることを考えると、開発全体のコストは大幅に下がりそうです。
特に注目したいのが、エージェント型タスクへの最適化です。 OpenHands や SWE-Agent といったエージェントフレームワークとスムーズに連携でき、 XML や関数呼び出し形式での構造化出力にも対応しています。プログラムナビゲーション、マルチステップ編集、コード検索など、これまで手作業に頼っていた複雑な開発タスクを自動化できるようになります。
提供方法の違いも面白いポイントです。 Devstral Small 1.1 は Apache 2.0 ライセンスでオープンソース化されており、 Hugging Face や Ollama 、 LM Studio などで手軽に利用できます。 RTX 4090 や 32GB RAM の Mac があればローカルでも動作するため、データを外部に送りたくない開発者には理想的でしょう。
一方の Devstral Medium 2507 は、 Mistral API やエンタープライズ契約での提供となり、企業独自のコードやデータセットを使った追加学習(ファインチューニング)にも対応しています。これにより、特定の業界やプログラミング規約に合わせたオーダーメイドの調整が可能で、大規模なコードベースや複雑なプロジェクト構造を扱う企業にとって、高い信頼性と精度を備えた強力なパートナーになりそうです。
実用面でも幅広い活用が期待できます。個人開発者なら VS Code の拡張機能やオフライン環境でのデバッグ支援として、企業ならプルリクエストの自動分析やパッチ生成といった業務効率化に役立つでしょう。
今回のリリースは、 AI を使ったソフトウェア開発の新たな段階を示すものと言えます。オープンソースコミュニティには自由度を、企業には高性能なソリューションを提供することで、 Mistral AI は開発者向け AI 市場での存在感を一気に高めました。