OpenAI は 2025 年 2 月 27 日、同社史上最大規模の言語モデル「 GPT-4.5 」(コードネーム: Orion )をリサーチプレビュー版として公開しました。このモデルは従来の推論( reasoning )に依存するアプローチとは異なり、教師なし学習を大規模にスケールアップすることで性能を向上させた新世代 AI として注目を集めています。
GPT-4.5 の最大の特徴は「深い世界知識」と「感情知能の向上」です。膨大なデータと計算リソースを投入することで、より広範で深い情報ベースを持ち、ユーザーの意図や感情的なニュアンスをより良く理解して共感的な応答を返す能力が強化されています。
OpenAI のテストによれば、例えば「テストに落ちて辛い」という入力に対し、GPT-4.5 は慰めの言葉をかけつつ寄り添う姿勢を見せたのに対し、以前の GPT-4o は淡々と解決策を提案するにとどまったといいます。この違いは、対話の「暖かさ」や自然さを重視する用途で特に価値を発揮するとされています。
また教師なし学習の改良により、事実と異なる情報や誤った応答(いわゆる「ハルシネーション:幻覚」)も大幅に削減されています。OpenAI のベンチマーク「 SimpleQA 」では、GPT-4.5 が GPT-4o や o1 を上回る正確性を示し、信頼性が向上したと報告されています。
技術的背景としては、Microsoft Azure の AI スーパーコンピューターを活用し、可能な限り多くの計算リソースを投入。これを「スケーリング法則」(より多くのデータと計算力があれば性能が上がるという考え方)の成果として位置づけていますが、一部ではこのアプローチが限界に近づいているとの見方もあります。
利用可能性については、リリース当初は月額 200 ドルの ChatGPT Pro ユーザーと API を利用する開発者に限定されています。翌週には ChatGPT Plus (月額 20 ドル)や Team ユーザー、さらにその翌週には Edu や Enterprise ユーザーにも提供が拡大する予定です。ただし、OpenAI 側の GPU 不足により全ユーザーへの即時展開は難しい状況とのことです。
CEO のサム・アルトマン氏は、GPT-4.5 が「巨大で高価なモデル」であると明言しており、開発者向け API 料金は GPT-4o の 30 倍(入力時)や 15 倍(出力時)と非常に高額です。また同氏は「これは推論モデルではないため、ベンチマークを圧倒するようなものではない」とも強調しており、複雑な計算や論理的推論が必要なタスクでは、推論に特化した o1 シリーズに軍配が上がる可能性があります。
OpenAI は、GPT-4.5 を「リサーチプレビュー版」と位置づけ、ユーザーと共にその能力を探求する段階としています。また年内には GPT-5 のリリースが予定されており、これは推論と教師なし学習を統合した、より汎用性の高いモデルになる見込みです。そのため、GPT-4.5 は感情知能や直感的な対話に特化した「最後の非推論モデル」になると言われています。
筆者の視点:待望の GPT-4.5 がリリースされましたが、色々と「言い訳」の多い発表となりました。多くの期待に反して、目立った性能向上がなく、むしろ価格の上昇だけが悪目立ちする結果となりました。特に、Grok 3 や Claude 3.7 の発表直後に投入されたことから、それに慌ててぶつけてきただけ、という見方が強まっています。また、「共感的なモデル」への進化という点も、根本的な技術革新ではなく、性能向上が限界に達したためにアライメントの調整(事後処理)をして意図的に付与された「性格」に過ぎないように思えます。
昨年末から指摘されていたように、大量の計算資源とトレーニングデータによる従来のアプローチは、そろそろ限界を迎えているようです。やはり今後は、より効率的な推論能力やエージェント型 AI の開発が主流になっていくことでしょう。
ただ、1 点今回のリリースで興味深いのは、OpenAI が「 GPU 不足 」を強調している点です。年始のディープシーク・ショック後、GPU の需要は減少するのではという見方もありましたが、推論フェーズでは依然として高い計算資源が求められ、むしろ不足が続いている状況のようです。この点は先週の NVIDIA の決算発表でジェンスン・フアン CEO も指摘していましたが、それを裏付ける発表となりました。