中国の Alibaba が 2025 年 7 月 21 日にリリースした「 Qwen3 」の最新版が、オープンソース AI 界に新たな貢献をしました。これまでトップの座にいた同じく中国の MoonShot AI のオープンソースモデル Kimi K2 を全分野で上回り、さらに有料の最高峰モデル Claude Opus 4 にも匹敵する性能を見せています。
今回の Qwen3 で最も注目すべきは、「非思考モード」に特化したことです。従来は思考プロセスを表示するハイブリッド方式でしたが、ユーザーの声を受けて思考モードと通常モードを分けて訓練し直しました。その結果、効率性と実用性が格段に向上しています。
性能面では、数学や科学の知識を問う GPQA では 77.5% のスコアを記録し、以前の 62.9% から大幅にアップしました。数学コンテストの AIME25 では 70.3% で、 Kimi K2 の 49.5% や Claude Opus 4 の 33.9% を大きく引き離しています。
コーディング分野での強さも圧倒的です。 LiveCodeBench では 79.2% という高スコアを叩き出し、 Kimi K2 の 52.0% や Claude Opus 4 の 51.8% を軽々と上回っています。これは OpenAI や DeepSeek といったライバルをも凌ぐ水準です。
今回技術面でも新しい試みがありました。今回 Alibaba は FP8 ( 8 ビット浮動小数点)という新しい計算方式を導入しています。従来の AI モデルは FP16 や FP32 といったより多くのビット数で計算していましたが、 FP8 では半分以下の情報量で同等の性能を実現できる用になっています。これにより、必要なメモリ量と計算負荷を大幅に削減でき、高性能な GPU がなくても十分に動作するようになりました。
従来のオープンソース界トップだった Moonshot AI の Kimi K2 と比べると、違いは歴然です。 Kimi K2 もエージェント機能やコーディングに強みを持つ優秀なモデルでしたが、推論能力や画像処理には限界があり、動作速度も遅めでした。一方 Qwen3 は、幅広い分野で高い性能を発揮し、しかも軽快に動作します。
このモデルの登場が持つ意味は非常に大きいものがあります。これまでは Google や OpenAI といった大手企業の有料モデルでないと得られなかった最高レベルの AI 機能が、誰でも無料で使えるようになりました。 Qwen3 は Hugging Face などのプラットフォームを通じてダウンロードできます。