LLMの新バージョンが続々登場 – 商用モデルとオープンソースモデルの性能競争が加速

投稿者:

最近、大規模言語モデル(LLM)の新しいバージョンの発表が相次いでいます。全てを紹介することはできませんが、主要な動きをまとめてみたいと思います。

まず、GoogleとOpenAIが、すでに発表されていたモデルを一般からアクセスしやすいようにしました。GoogleはGemini1.5ProをAPI経由で180カ国から利用可能にし、OpenAIはGPT4.5 TurboをChatGPTで利用できるようにしました。また、GoogleはGemini1.5Proの発表とほぼ同時に同社のオープンソースLLMであるGemmaのアップデートとカスタマイズモデルも発表しています。

オープンソースモデルでは、Stability AIがStable LM 2 12Bをローンチしました。性能は他のオープンソースモデルと比べてまずまず、といったところで、トップに立つほどではないようです。一方、Mistral AIがMixtral 8x22Bをリリースし、現在オープンソースLLMでトップの性能を誇るCohereのCommand R+よりも性能が良さそうだということで話題になっています。(Mixtral 8x22Bに関しては公式の性能発表がないので、オープンソースのコミュニティの中で盛んに性能評価がされています)

さらに、Metaは来月、GPT4と同等の性能を持つと言われるオープンソースLLM「Llama3」を発表すると明かし、注目を集めています。オープンソースモデルの中では群を抜いた性能を示すのではないかと期待されて注目されていますが、実際にどうなるか、正式なリリースを待ちたいと思います。

以上のように、商用のプロプライエタリモデルとオープンソースモデルの両方で、新バージョンの発表が相次ぎ、各社が性能を競っています。性能面では、商用モデルが先行していますが、オープンソースモデルも徐々に追いついてきています。最近は驚くような性能向上はありませんが、細かなステップアップによって各モデルが洗練されてきていて、着実に使いやすくなっていることを実感します。

オープンソースモデルも、企業が社内利用するには十分な性能に達してきているようです。一般的で広範囲の知識を扱うには膨大なデータセットとパラメータが必要ですが、企業が特定の範囲のデータ(例えば製品情報や社内情報)で使用するのであれば、現在の性能でも十分ではないでしょうか。

LLMの競争が激しくなり、性能が向上していくのは、我々利用者にとって大きなメリットです。今後の展開に注目していきたいと思います。