xAI がコスト効率重視の「 Grok 4 Fast 」を発表、最大 98% のコスト削減を実現

投稿者:

xAI は 2025 年 9 月 20 日、コスト効率と高速性を大幅に向上させた新 AI モデル「 Grok 4 Fast 」を発表しました。このモデルは従来の Grok 4 と比べて計算資源の消費を最大 98% 削減しつつ、推論・作業速度や精度でほぼ同等の性能を発揮します。

主な技術的特徴

Grok 4 Fast の最大の特徴は、その効率性にあります。 Grok 4 比で平均 40% 少ない「思考トークン」を使用し、応答速度は 10 倍、初回のトークン出力までの待ち時間は約 2.5 秒まで短縮されています。毎秒 342 トークンという超高速応答を実現し、リアルタイムでの質疑応答やコーディング補助など、開発者・知識労働者の実務にも適しています。

また、200 万トークンの大規模コンテキストウィンドウにより、巨大な文書やコードベース、長い会話履歴の一括処理が可能です。従来は推論用と非推論用で別々だったモデルを一体化し、用途に応じてシステムプロンプトで制御することで、低遅延かつ低コストで幅広いタスクを実行できます。

価格設定と利用形態

xAI の API では、入力 100 万トークンあたり 0.20 ドル(約 29 円)、出力 100 万トークンあたり 0.50 ドル(約 74 円)と非常に安価に設定されています。一定期間は一部サービスで無料利用も可能です。

業界への影響

GPT-4.1 や Gemini 2.5 、 Claude 4 Extended などトップモデルに近い実用性を示し、「スピード領域」専用版として高評価を受けています。

Grok 4 Fast は、「大量データを高速・廉価かつ十分な精度で処理したい」という企業・開発者ニーズに応える新世代 AI として位置づけられています。