AI モデルが CFA(証券アナリスト) 試験の全レベルで合格水準を達成

投稿者:

ニューヨーク大学( NYU )の研究チームによる最新の研究で、OpenAI 、Google 、Anthropic などの最先端 LLM (大規模言語モデル)が、CFA (公認証券アナリスト)試験の全レベルで合格点を達成したことが明らかになりました。この研究は、2025 年 9 月 22 日に発表されたもので、金融業界における AI の実用性を示す成果として注目を集めています。

この研究は、AI を活用した資産運用プラットフォームのスタートアップ Goodfin と NYU Stern School of Business の Srikanth Jagabathula 教授が主導し、23 種類の主要 AI モデルを CFA の模擬試験で評価しました。その結果、OpenAI の o4-mini が総合 79.1% 、Google Gemini 2.5 Pro が 75.9% 、Anthropic Claude Opus 4 が 74.9% のスコアを記録し、いずれも推定合格ライン(約 63 ~ 65% )を大きく上回りました。

特筆すべきは、これまで AI が苦戦していた CFA レベル III のエッセイ(記述)問題において、各モデルが大幅な進歩を見せたことです。思考過程を逐一説明する Chain-of-Thought プロンプトを用いることで、複雑な分析や戦略的思考が求められる問題への対応能力が向上し、エッセイの精度が 15% 改善されました。人間が合格するために約 1,000 時間の勉強時間を要する試験を、AI はわずか数分で突破したことになります。

ただし、実務への応用にあたっては、性能だけでなくコストや応答速度も重要な要素です。高度な推論を要する質問には高価なフロンティアモデルを、単純な質問には高速で省コストのモデルを使い分けることが、実運用では最適とされています。例えば、Gemini 2.5 Flash はコストパフォーマンスに優れており、最高性能モデルと比べて最大 11 倍のコスト差がありました。

2 年前の研究では、AI はレベル I と II には合格できたものの、レベル III のエッセイ問題で苦戦していました。今回の結果は、AI がプロフェッショナル水準の金融推論・分析能力を獲得したことを示すものであり、金融業界向け AI 活用の重要な転換点となりそうです。Goodfin の創業者 Anna Joo Fee 氏は、「これらの結果は、AI が資産運用業界を変革し、テックネイティブな顧客に洗練された製品と戦略を提供する未来を指し示している」とコメントしています。