Z.aiのGLM-5.1、オープンソースモデルとして初めてSWE-Bench Proで首位を獲得

投稿者:

中国の AI 企業 Z.ai(旧 Zhipu AI)は、2026年4月7日に最新の AI モデル「GLM-5.1」をオープンソースで公開しました。前世代の GLM-5 をベースに学習方法を改善したモデルで、特にプログラミング支援や、人間の指示なしに長時間にわたって作業を進める「エージェント」としての能力が強化されています。

このモデルが最も注目される点は、一つの作業を最大 8 時間にわたって自律的にやり遂げられることです。人間がその場で指示を出さなくても、計画を立て、試行錯誤しながら、最終的な成果物まで仕上げることができます。実際の検証では、データベースの処理速度を改善するタスクにおいて、600 回以上の試行と 6,000 回以上のツール操作を経て、従来の最高記録と比べて約 6 倍のクエリ処理性能を達成しました。

プログラミング能力の評価指標として広く使われる SWE-Bench Pro では 58.4 点を記録し、OpenAI の GPT-5.4(57.7 点)や Anthropic の Claude Opus 4.6(57.3 点)を上回りました。無償公開モデルとして同ベンチマークの首位に立つのは初めてのことで、これまでは有料の商用モデルが独占してきた領域です。

利用コストも抑えられており、API 経由での利用料金は入力 100 万トークンあたり 1.00 ドル(約 150 円)、出力 100 万トークンあたり 3.20 ドル(約 480 円)です。ライセンスも商用利用を含めて自由に使える MIT ライセンスを採用しており、自社システムへの組み込みを検討しやすい条件が整っています。

米中の技術覇権争いという観点でも注目に値します。Z.ai は 2025年1月から米国の輸出規制対象リストに掲載されており、高性能な NVIDIA 製 GPU を調達できない状況にあります。それでも Huawei の国産チップだけを使って、世界トップクラスのモデルと肩を並べる成果を出したことは、輸出規制による技術封じ込めの難しさを改めて示すものとして、産業界や政策立案者の間で広く議論されています。

一方で、留意すべき点もあります。現在公表されているベンチマーク数値は Z.ai 自身の測定によるもので、第三者機関による独立した検証はまだ行われていません。また、処理速度については毎秒約 44.3 トークンと、GPT-5.4 の約半分にとどまるとの報告があり、大量処理が必要な用途では実際の使い勝手を慎重に見極める必要があります。