中国のテクノロジー大手 テンセント が、「高速思考( fast-thinking )」をコンセプトにした新しい AI モデル「 Hunyuan Turbo S 」をリリースしました。 2 月 27 日に発表されたこのモデルは、従来の「じっくり考える」タイプとは異なり、質問に対して 1 秒未満で応答するという圧倒的な速さが特徴です。
Hunyuan Turbo S は、Mamba * と Transformer という 2 つの技術を融合したハイブリッドアーキテクチャを採用し、計算負荷やメモリ使用量を削減しながらも高い効率性を実現しています。具体的には、従来モデルと比較して出力速度が 2 倍になり、最初の単語が表示されるまでの遅延が 44 % 削減されました。
コスト面でも大きな進歩があり、 API の価格は入力が 100 万トークンあたり 0.8 元(約 0.11 ドル)、出力が 100 万トークンあたり 2 元(約 0.28 ドル)と、従来の Turbo モデルよりも大幅に安価になっています。
テンセントによると、Hunyuan Turbo S は知識、数学、推論などの一般的な AI ベンチマークにおいて、DeepSeek の V3 、OpenAI の GPT-4o 、Anthropic の Claude 3.5 Sonnet といった主要モデルと同等以上の性能を発揮するとのこと。特に 17 のサブカテゴリー中 10 カテゴリーで最速の結果を出し、ChatGPT 4o を 15 カテゴリー、DeepSeek-V3 を 12 カテゴリーで上回ったと主張しています。
このリリースは、中国国内の AI 競争が激化する中で行われました。特に、ライバル企業 DeepSeek が開発した R1 モデルへの直接的な対抗馬として位置づけられています。DeepSeek R1 は低コストかつ高性能で知られ、中国国内でのダウンロード数で OpenAI の ChatGPT を上回るなど注目を集めていました。
現在、Hunyuan Turbo S は Tencent Cloud 経由の API で利用可能で、 1 週間の無料トライアルも提供されています。テンセントは、自社の消費者向け AI チャット「 Yuanbao 」にもこのモデルを段階的に導入する計画です。
*Mamba は 2023 年 12 月 1 日に発表された新しい深層学習アーキテクチャで、カーネギーメロン大学の Albert Gu とプリンストン大学の Tri Dao によって共同研究・開発されました。Transformerアーキテクチャの計算効率の問題、特に長いシーケンスの処理における課題に対応することを目的とした研究となっています。