コンテンツへスキップ
AI News Updates

AI News Updates

(主に海外の)AI関連ニュースの中で筆者が気になったものを簡潔にアップデートしています

  • Home
  • お問い合わせ

カテゴリー: ベンチマーク

2025年5月22日 AI Chat / OpenAI / ベンチマーク

OpenAI、医療分野における AI 評価の新基準「 HealthBench 」を発表

OpenAI は 2025 年 5 月 12 日、医療分野における AI システムの性能と安全性を評価するための新しいベンチマーク「 HealthBench 」を発表しました。これは AI モデル、特に大規模言語モデル(

続きを読む
2025年4月18日 ベンチマーク

AI 評価プラットフォーム「LMArena」が企業化

カリフォルニア大学バークレー校発の AI 評価プラットフォーム「 LMArena 」(旧 Chatbot Arena )が、2025 年 4 月 17 日に正式にスタートアップ企業「 Arena Intelligence

続きを読む
2025年4月15日 OpenAI / ベンチマーク

OpenAI、AI の web 検索能力を評価する「BrowseComp」ベンチマークをオープンソースで公開

OpenAI は 2025 年 4 月 10 日、AI エージェントがインターネット上の見つけにくい情報を探し出す能力を評価する新しいベンチマーク「BrowseComp」をオープンソースとして公開しました。 Browse

続きを読む
2025年3月26日 ベンチマーク

ARC-AGI-2:AI の推論能力を評価する新しいベンチマーク

ARC Prize Foundation は AI の推論能力と効率性を測る「ARC-AGI-2」ベンチマークを発表しました。このベンチマークは、単なる計算力に頼ることを防ぎ、 AI が新しいタスクに適応し推論する能力を

続きを読む
2025年1月30日 ベンチマーク

Scale AIとCAISが「Humanity’s Last Exam」を発表 – AIモデルの知識と推論能力を極限まで試す新ベンチマーク

米スタートアップのScale AI と Center for AI Safety ( CAIS )が共同開発した新たな AI ベンチマーク「 Humanity’s Last Exam (人類最後の試験)」は、

続きを読む

Archive

  • 2025年5月
  • 2025年4月
  • 2025年3月
  • 2025年2月
  • 2025年1月
  • 2024年12月
  • 2024年11月
  • 2024年10月
  • 2024年9月
  • 2024年8月
  • 2024年7月
  • 2024年6月
  • 2024年5月
  • 2024年4月
  • 2024年3月
  • 2023年6月
  • 2023年5月
  • 2023年4月

Category

  • **Editor's Insight**
  • AI Tools
    • *5 Star Club
    • 3D生成
    • AGI
    • AI Chat
    • AIアバター・リップシンク
    • AIエージェント
    • AI検索
    • Chrome拡張機能
    • PDFチャット
    • Speech-to-Text(S2T:音声認識)
    • その他
    • カスタマーサポート・コールセンター
    • コンテンツ制作
    • デザインツール
    • ビジネスツール
    • プログラミング・コーディング
    • ベンチマーク
    • 動画生成・TTV
    • 動画編集ツール
    • 情報検索
    • 教育ツール
    • 画像生成・TTI
    • 画像編集
    • 研究支援
    • 音声生成・TTS
    • 音声認識
    • 音楽生成・TTM
  • AI倫理と規制
  • IPO関連ニュース
  • その他
  • カンファレンス・調査報告
  • 企業のAI取り組み
    • Adobe
    • Alibaba
    • Amazon
    • AMD
    • Anthropic
    • Apple
    • Baidu
    • BlackForestLabs
    • ByteDance
    • DeepSeek
    • ElevenLabs
    • Figure
    • Google
    • Intel
    • Kling AI
    • Meta
    • Microsoft
    • Midjourney
    • Mistral
    • NVIDIA
    • OpenAI
    • Perplexity
    • Runway
    • Softbank
    • StabilityAI
    • Tencent
    • Tesla
    • Waymo
    • xAI
    • その他
  • 政府・行政のAI取り組み
  • 未分類
  • 産業分野でのAI活用
    • エンターテイメント・ファッション
    • カスタマーサポート
    • ゲーム業界
    • セキュリティ
    • ロボット
    • 医療分野
    • 小売業
    • 教育
    • 気象予報
    • 法律分野
    • 物流
    • 自動運転・ロボタクシー
    • 製造業
    • 軍事分野
    • 金融
  • 米国以外
    • EU
    • UAE
    • その他
    • イギリス
    • オーストラリア
    • カナダ
    • サウジアラビア
    • スイス
    • スペイン
    • フランス
    • ブラジル
    • 中国
    • 日本
    • 韓国
  • 著名人のAI関連活動
    • Demis Hassabis
    • Elon Musk
    • Jensen Huang
    • Mark Zuckerberg
    • Sam Altman
    • Sundar Pichai
    • 孫正義
  • 資金調達

  筆者:"aiupdate"
2008年〜NLP開発PJに参画。
2015年〜現在:US在住
WordPress テーマ: Maxwell by ThemeZee