Alibaba Cloud(アリババクラウド)の大規模言語モデルシリーズQwenが、ソフトウェア開発に特化した新しいAIモデル群「Qwen2.5-Coderシリーズ」を発表しました。中でも最も注目されているのが、325億のパラメータを搭載した32Bモデルです。
このモデルは、128,000トークンのコンテキストウィンドウをサポートし、40以上のプログラミング言語に対応しています。また、Apache 2.0ライセンスで完全オープンソース化されているのが特徴です。
ベンチマークテストでは、HumanEvalで92.7%、MBPPで90.2%、Aiderで73.7%という優れた結果を示しており、GPT-4oやClaude 3.5 Sonnetと同等かそれ以上の性能を発揮しています。
モデルのトレーニングには、一般的な言語データから18.5兆トークン、プログラミング関連コンテンツから5.5兆トークンの合計20兆トークン以上の大規模データセットが使用されています。
Qwen2.5-Coderシリーズは、コード生成、バグ修正、コード理解などの機能を提供し、マルチ言語対応により開発者の言語学習コストを削減します。また、Cursorなどのコードエディタとの統合も可能です。