【Breaking News】xAI が Grok3 を発表:「地球上で最も賢い AI 」として自信を見せる

投稿者:

Elon Musk の xAI が、最新 AI モデル「 Grok3 」を「地球上で最も賢い AI 」として発表しました。このモデルは、主要なベンチマークで OpenAI の GPT-4o 、 Anthropic の Claude 3.5 Sonnet 、 Google の Gemini-2 Pro など競合モデルを上回る性能を達成しています。

特筆すべきは、数学分野の AIME’24 テストで 52 点( GPT-4o は 48 点)、科学分野の GPQA で 75 点( DeepSeek-V3 は 68 点)、プログラミングの LCB ベンチマークで 57 点( Gemini-2 Pro は 49 点、 GPT-4o は 52 点)と、各分野で高いスコアを記録したことです。

Grok-3 は前身の Grok-2 と比較して 10 倍以上の計算能力を持ち、 20 万台以上の GPU を使用して訓練されました。これにより、複雑な数学やプログラミングの問題を迅速かつ正確に解決できる能力が大幅に向上しています。

新機能としては、インターネットや X (旧 Twitter )から情報を検索・要約する「 DeepSearch 」、複雑な問題解決のための「 Big Brain Mode 」、 AI の思考レベルを調整できる「 Reasoning Slider 」などが搭載されています。また、テキストと画像の両方を処理できるマルチモーダル機能や、「 Aurora 」という独自の画像生成ツールも備えています。

実ユーザーが使用してみた感想・評価を見ると、高度な推論能力や構造化された論理問題を解決する能力が高く評価されています。一方、複雑なプログラミングタスクでは GPT-4o や Claude に劣る場合があり、ユーモアや創造性の面でも改善の余地があるとされています。また、引用や URL 生成において誤った情報を提供することがある点も指摘されています。

Grok-3 は X の「 Premium+ 」会員(月額 40 ドル)または Grok 専用のアプリやウェブサイト(無料で制限付き・月額 30ドルの有料会員で大幅に制限アップ)を通じて利用可能となっています。

xAI は今後、 Grok-3 のさらなる改良を進める予定で、特に推論能力や計算効率の向上を目指しています。また、より高度な論理的推論を可能にする「 Reasoning 」バージョン(現在ベータ版)も開発中です。