GPT-4 Turboが再びトップに：Metaの新モデルLlama3もオープンソースで首位

2024年4月23日

投稿者: aiupdate

GPT-4 Turboが再びトップに：Metaの新モデルLlama3もオープンソースで首位

文字サイズ

大規模言語モデル（LLM）の性能を比較する「Chatbot Arena」において、OpenAIのGPT-4 Turboが再びトップの座を獲得しました。しばらくの間、Anthropic社のClaude 3 Opusに首位を譲っていましたが、最新バージョンのgpt-4-turbo-2024-04-09がリリースされたことで、再びリーダーボードの頂点に立っています。

*Image Source: Capture from LMSYS* Chatbot Arena

GPT-4 Turboの性能向上は、コーディング、数学、推論、ライティングなどの分野で顕著に見られます。Chatbot Arenaでは、全体ランキングだけでなく、コーディングと英語のカテゴリーでもトップに立っています。一方、Claude 3 Opusは3位に後退し、GPT-4 Turboの旧バージョンが2位につけています。

Chatbot Arenaは、ユーザーがモデルの名称を知ることなく、複数のLLMをチャット形式で比較できるプラットフォームです。「Arena (battle)」モードで勝敗を投票することで、Gemini ProやClaude 3、Mistral-Large-2402など82のLLMのランキングに影響を与えることができます。

また、Metaが先日リリースしたLlama3 70Bモデルは、早くもオープンソースモデルのトップにたちました。大手テック企業による新モデルの開発競争が加速する中、LLM市場の動向から目が離せません。

GPT-4 Turboが再びトップに：Metaの新モデルLlama3もオープンソースで首位

関連記事

Anthropic、約40万件のClaude Code利用状況を分析—AIコーディングの成否は専門知識

Pew Research 2026：AI を使いながら信用しない——米国人の複雑な AI 観

【 Breaking News 】ChatGPT のシェアが初めて 50% を下回る、Gemini と Claude が存在感を高める