Alibabaが推論特化型AIモデル「Qwen3-Max-Thinking」を発表、主要ベンチマークで最先端性能

投稿者:

Alibabaは2026年1月26日、最新の推論特化型AIモデル「Qwen3-Max-Thinking」を発表しました。同モデルは19の確立されたベンチマークで主要なAIモデルに匹敵する性能を実証し、複数の重要指標で既存モデルを上回る結果を示しています。

Qwen3-Max-Thinkingの最大の特徴は、適応的ツール使用機能です。従来のAIでは、ユーザーが「検索機能を使う」「コード実行機能を使う」といったツールを事前に手動で指定する必要がありました。しかし同モデルは、会話の文脈から必要なツールを自律的に判断し、適切なタイミングで活用します。

具体的には、最新情報が必要な質問には検索機能を、データ分析が求められる場合にはコード実行機能を、過去の会話内容を参照すべき場面ではメモリ機能を、それぞれ自動的に選択します。Search、Memory、Code Interpreterといった機能が組み込まれており、ユーザーは複雑な操作を意識することなく、自然な会話を通じて高度なタスクを実行できるようになりました。

性能面では、テストタイム・スケーリング手法を採用しています。これは、回答生成時により多くの計算時間をかけることで精度を向上させる手法です。この手法により、GPQAでは90.3から92.8へ、LiveCodeBench v6では88.0から91.4へとスコアが大幅に向上しました。また、262,144トークンという大規模なコンテキストウィンドウを搭載し、複雑な文脈理解を可能にしています。

ビジネス領域での活用も期待されています。戦略的選択肢の評価、リスク評価、市場動向分析など、複数の要素を考慮する必要がある複雑な意思決定において、推論プロセスの透明性を保ちながら分析フレームワークを提供できる点が評価されています。

市場の反応は好意的で、この発表を受けてAlibabaの株価は2021年以来の最高値に達しました。中国企業がAIの最先端で競争力を持つモデルを次々と投入することで、技術主権とグローバル競争をめぐる議論も活発化しています。同モデルは現在Qwen Chatで利用可能となっており、企業や研究者による実用化が進むと見られています。