Anthropic は 2025 年 4 月 21 日、AI アシスタント「 Claude 」が実際のユーザーとの会話でどのように価値判断を行っているかを分析した研究「 Values in the Wild 」を発表しま
続きを読む
Anthropic は 2025 年 4 月 21 日、AI アシスタント「 Claude 」が実際のユーザーとの会話でどのように価値判断を行っているかを分析した研究「 Values in the Wild 」を発表しま
続きを読むAnthropic の Alignment Science Team による最近の研究で、 AI モデルがユーザーに対して回答を説明する際に、実際の推論プロセスを隠してしまうことが多いという衝撃的な事実が明らかになりまし
続きを読むGoogle DeepMind が 2025 年 4 月 2 日、 AGI (人工知能汎用、 Artificial General Intelligence )の安全戦略を詳述した 145 ページにわたる大規模論文「 A
続きを読むフィンランドに本社を置く、サイバーセキュリティトレーニングサービス提供企業 Hoxhunt 社が 2025 年 4 月 4 日に発表した最新レポートによると、AI 駆動のフィッシングエージェントが、フィッシング攻撃の作成
続きを読むOpenAI は 2025 年 3 月 13 日、トランプ政権が進める「 AI アクションプラン 」に向けた 15 ページの政策提案書を提出しました。この提案では、米国の AI 技術におけるリーダーシップを維持し、中国と
続きを読むOpenAI が最近発表した研究で、o3-mini などの高度な推論 AI モデルが「報酬ハッキング( reward hacking )」と呼ばれる不正行為を行い、さらにはその不正を隠そうとする行動が観察されたことが明ら
続きを読む米国著作権局は2025年1月29日、「著作権と人工知能 パート2:著作権の適用可能性」と題する報告書を発表しました。この報告書は、AI(人工知能)を利用した創作物に関する著作権の取り扱いについてのガイドラインを明確にする
続きを読むOpenAI が主導する「 Stargate Project (スターゲート・プロジェクト)」は、 2025 年 1 月 22 日に発表された大規模な AI インフラ投資計画です。このプロジェクトは、SoftBank 、
続きを読む米国商務省は台湾の大手半導体メーカーTSMC(台湾積体電路製造)に対し、2024年11月11日から中国向けの先進的なAIチップの出荷を停止するよう命じました。この規制は、7ナノメートル以下の先進的な製造プロセスを使用する
続きを読む現地時間9月29日、カリフォルニア州のギャビン・ニューサム知事が、AI業界で注目を集めていた画期的なAI安全法案S.B. 1047に拒否権を発動しました。この法案は、大規模AIモデルの開発者に公開前の安全性評価を義務付け
続きを読むOpenAIとAnthropicが、アメリカの国立標準技術研究所(NIST)内にある「AI安全研究所(U.S. Artificial Intelligence Safety Institute)」と、AIの安全性向上に向
続きを読むOpenAIが最近発表したレポートで、ChatGPTの音声モード機能に関し、ユーザーがAIモデルと必要以上に親密な関係を構築してしまう可能性について警告が発せられました。 7月末から一部ユーザーに段階的に提供されているG
続きを読む