Reka AI、最新マルチモーダル言語モデル「Reka Core」を公開

また新たに強力なAI企業が現れました。Reka AIが、新たなマルチモーダル言語モデル「Reka Core」を発表しました。

Reka Coreは、画像、音声、動画、テキストなど、マルチモーダルな入力を理解することができます。開発期間が非常に短期間であったにもかかわらず、OpenAIのGPT-4やAnthropicのClaude 3 Opusなど、主要なプレーヤーに匹敵する性能を示しました。パラメータ数は非公開ですが、多様な公開データ、ライセンスデータ、合成データなどで「倫理的に」トレーニングされているとされています。

同モデルは、動画認識テストでGoogleのGemini Ultraを上回り、画像理解（MMUMベンチマーク）でもトップモデルに迫る性能を示しています。さらに、コーディング（HumanEval）や推論（GSM8K）の分野では、GPT-4をも上回る結果を出しています。

開発にあたっては、性能目標から逆算する「逆算型（Upside-down）トレーニング」アプローチを採用することで急速な性能向上を果たしたようです。また、利用料金の設定を低く抑えることでeコマースやゲームなどの多様なユースケースに対応するとしています。同社はSnowflake、Oracle、AI Singaporeとのパートナーシップを築いています。

Rekaは、DeepMind、Google、Metaの元研究者たちによって設立されたサンフランシスコベイエリアを拠点とするAIスタートアップです。2023年にステルスモードから登場し、DST Global PartnersとRadical Venturesが主導して5800万ドル（約89億円）の資金調達を済ませています。

Rekaは彗星の如く業界に現れました。テキスト中心のモデルと比較して、Reka Coreのマルチモーダル性能は特徴的ですし、性能向上のスピードは十分な資金を持つ大手と比べて印象的です。また、同社はSnowflakeなどとパートナーシップを築くことで、すでにBtoBサービスで顧客基盤の構築を固めているようです。ビジネス展開の仕方も上手だなと思わせます。注目の企業です。