2025年1月30日 ベンチマーク Scale AIとCAISが「Humanity’s Last Exam」を発表 – AIモデルの知識と推論能力を極限まで試す新ベンチマーク 米スタートアップのScale AI と Center for AI Safety ( CAIS )が共同開発した新たな AI ベンチマーク「 Humanity’s Last Exam (人類最後の試験)」は、 続きを読む