米シアトルに拠点を置くAI2(Allen Institute for AI)という研究所が、新しいAI言語モデル「OLMo 2」を発表しました。このOLMo 2は、誰でも自由に使えるオープンソースのモデルです。
OLMo 2には、7Bパラメータと13Bパラメータという2つのバージョンがあり、どちらも5兆トークンという膨大なデータで事前学習されています。その結果、7Bパラメータ版でもMetaのLlama 3.1-8Bモデルよりも高い性能を示しています。
OLMo 2の最大の特徴は、完全にオープンソースであるということです。Apache 2.0ライセンスという、商用利用も可能なライセンスで公開されているため、誰でも自由に使うことができます。モデルの構造や学習に使われたデータ、プログラムのコード、性能評価の方法など、すべてが公開されていて、Open Source Initiativeが定める「オープンソースAI」の定義を完全に満たす数少ないモデルの1つとなっています。
また、OLMo 2は技術的にも優れており、従来のモデルよりも安定して学習できるようになっています。さらに、事前学習だけでなく、事後学習にも最新の技術を駆使することで、より高い性能を実現しています。
OLMo 2の登場は、AI業界に大きな変化をもたらす可能性があります。誰でも自由に使えるオープンソースモデルなので、スタートアップや中小企業でもAIを導入しやすくなります。また、世界中の研究者や開発者がベースモデルとしてOLMo 2を利用し、優れたAIアプリケーションを開発していくことが期待されます。