Z.ai、ビジョンコーディング特化モデル「GLM-5V-Turbo」を正式リリース

投稿者:

中国の AI スタートアップ Z.ai(旧 Zhipu AI)は、2026 年 4 月 1 日、デザイン画像を見てコードを自動生成する AI モデル「GLM-5V-Turbo」を正式に公開しました。画像や映像を直接理解してコードを出力する能力を持つ、同社初のモデルです。

最大の特徴は、デザインの見た目をそのまま再現するコードを生成できる点です。Figma などのデザインツールから書き出したファイルや手書きのスケッチを入力すると、実際に動作する Web ページのコードを出力します。また、表示が崩れたページのスクリーンショットを渡すと、どこに問題があるかを視覚的に判断して修正コードを提案します。さらに、Web サイトを自動的に巡回してページ構成を把握し、同等の画面を再現する機能も備えています。

こうした機能を支えているのが、独自開発のビジョン処理技術です。一般的な AI が画像をいったん文字情報に置き換えてから処理するのに対し、GLM-5V-Turbo は視覚情報をそのまま扱うことで、レイアウトの細部や色のニュアンスを正確に捉えられます。

性能評価では、デザインからコードを生成する精度を測る「Design2Code」ベンチマークで 94.8 のスコアを記録しました。同じ指標で Claude Opus 4.6 が 77.3 であることを踏まえると、フロントエンド生成に絞った領域での優位性がうかがえます。ただし、サーバー側の処理やコードベース全体の解析といった作業では Claude Opus 4.6 の方が得意としており、Z.ai 自身も両者を競合ではなく役割の異なるツールとして位置付けています。画像解析が必要な場面だけ GLM-5V-Turbo を活用し、それ以外の作業は既存のツールで進めるといった組み合わせを想定しています。

利用料金は入力 1,000 万トークンあたり $1.20(約 180 円)、出力は $4.00(約 600 円)です。既存の OpenAI 互換ツールとの連携も可能で、導入のハードルは比較的低いといえます。

Z.ai は 2026 年 1 月 8 日に香港証券取引所へ上場しており、現在 1 万 2,000 社以上の法人顧客と 4,500 万人の開発者が同社のサービスを利用しています。フロントエンド開発の効率化を検討している企業にとって、注目しておく価値のある選択肢です。