中国系 Z.ai が GLM-4.5 をリリース、 DeepSeek を下回る低価格でエージェント特化の高性能モデル

投稿者:

中国系 AI スタートアップ「 Z.ai (旧 Zhipu )」が 2025 年 7 月 28 日、新しいオープンソース AI モデル「 GLM-4.5 」ファミリーをリリースしました。このモデルは、推論、コーディング、エージェント機能において最先端の性能を実現しながら、 DeepSeek の価格を大幅に下回る低コストでの提供を実現し、世界的な AI 競争に新たな波紋を投げかけています。

GLM-4.5 シリーズは、総パラメータ数 3550 億・アクティブパラメータ 320 億の主力モデル「 GLM-4.5 」と、総パラメータ数 1060 億・アクティブパラメータ 120 億の軽量版「 GLM-4.5-Air 」の 2 つのモデルで構成されています。 Mixture of Experts ( MoE )アーキテクチャを採用し、推論時に必要なパラメータのみをアクティブにすることで、計算効率を高めコスト削減を実現しています。

価格面では、 API の利用料金が入力トークン 100 万あたり 0.11 ドル(約 16 円)、出力トークン 100 万あたり 0.28 ドル(約 42 円)と設定されており、 DeepSeek の R1 (入力 0.14 ドル(約 21 円)、出力 2.70 ドル(約 400 円))や Anthropic の Claude 3 Opus (入力 15 ドル(約 2226 円)、出力 75 ドル(約 11130 円))を大幅に下回る価格となっています。

GLM-4.5 の性能は、推論、コーディング、エージェント能力を評価する 12 の代表的なベンチマークで総合スコア 63.2 を達成し、全モデル中 3 位にランクインしました。これは国内およびオープンソースモデルでは最高位の成績です。特にエージェント機能では、 BrowseComp ベンチマークで Claude 4 Opus の 18.8% を上回る 26.4% の正答率を記録し、 o4-mini-high の 28.3% に近い性能を示しています。

コーディング分野でも優れた成果を上げており、 SWE-Bench Verified で 64.2% 、 Terminal-Bench で 37.5% の成功率を達成しました。また、ツール呼び出しの信頼性において 90.6% で Claude 4 Sonnet を上回る結果を示しており、実用的なコーディングアシスタントとしての能力の高さを証明しています。

GLM-4.5 は「エージェントネイティブ設計」として開発されており、複雑な推論やツール使用のための「思考モード」と即時応答のための「非思考モード」を切り替えることができます。

効率性の面でも注目すべき特徴があります。 GLM-4.5 は DeepSeek の R1 ( 6710 億パラメータ)の半分以下のパラメータ数で同等以上の性能を発揮し、 Nvidia の H20 チップ 8 枚で動作可能です。これは DeepSeek の R1 が必要とするハードウェアリソースの半分で済むため、運用コストを大幅に削減できます。

MIT ライセンスの下でオープンソース化されており、商用利用や二次開発が可能です。モデルウェイトは Hugging Face や ModelScope で公開されており、世界中の開発者がアクセスできます。また、 Z.ai のプラットフォームや API を通じた利用も可能で、 OpenAI 互換 API としてサードパーティツールとの連携も容易です。