Google DeepMindが発表した新しいAIモデル「AlphaGeometry2」が、過去25年間の国際数学オリンピック(IMO)の幾何学問題の84%を解決するという驚異的な成果を上げました。これは平均的な金メダリストのパフォーマンスを上回る成績です。
このAlphaGeometry2は、Googleの最新言語モデル「Gemini」のアーキテクチャと、DDAR(Deductive Database Arithmetic Reasoning)と呼ばれる「シンボリックエンジン」を組み合わせたモデルです。シンボリックエンジンとは、人間が読み書きできるシンボルや概念を使用して、論理的なルールに基づいて推論を行うエンジンです。このことにより、前バージョンのAlphaGeometryが54%だった解答精度を、84%にまで大幅に向上させることに成功しました。
具体的な性能を示す指標として、IMO-AG-50というベンチマークでは、50問中42問を解決。これは平均的な金メダリストのスコアである40.9問を上回る成績です。
ただし、現状では変数の数が可変の問題や非線形方程式、不等式には対応できないという技術的な制限もあります。
インペリアル・カレッジ・ロンドンの数学者ケビン・バザード氏は、「近い将来、コンピュータがIMOで満点を取る日が来るだろう」と述べています。DeepMindは今後、数論や代数、組み合わせ論などの分野にもAIの適用を広げていく計画です。