x.AIは言語モデル「Grok」の新しいアップグレード版「Grok-1.5Vision」を発表しました。このバージョンはテキストだけでなく、図表やドキュメント、チャートなど様々なタイプの視覚データを理解し処理する「マルチ
続きを読む
x.AIは言語モデル「Grok」の新しいアップグレード版「Grok-1.5Vision」を発表しました。このバージョンはテキストだけでなく、図表やドキュメント、チャートなど様々なタイプの視覚データを理解し処理する「マルチ
続きを読む米国時間4月5日、Metaは、AI生成コンテンツへの対応方針の見直しを発表しました。 Metaは、独立した監督委員会からの意見を取り入れ、2024年5月から、AIで生成または操作された画像、動画、音声など、幅広いコンテン
続きを読むデジタルクリエイティブ業界に衝撃が走っています。米Bloombergが報じたところによると、Adobe社が開発した画像生成AIソフト「Firefly」が、実は競合他社のMidjourneyが生成した画像を学習データに使用
続きを読む米国議会のアダム・シフ議員が、「生成AI著作権開示法」という新しい法案を提出しました。この法案は、AIシステムをリリースする前に、学習データセットで使用された著作権で保護された素材を著作権登録局に開示することを、AI企業
続きを読む新しい音楽生成AI「Udio」を紹介します。 Udioで制作された楽曲を聴いてみると、その高い質に驚かされます。現時点では、競合のSunoで作られた楽曲の方がまだ一歩リードしているように感じますが、Udioはまだリリース
続きを読む最近、大規模言語モデル(LLM)の新しいバージョンの発表が相次いでいます。全てを紹介することはできませんが、主要な動きをまとめてみたいと思います。 まず、GoogleとOpenAIが、すでに発表されていたモデルを一般から
続きを読む米Bloombergが報じたところによると、ニューヨーク証券取引所(NYSE)のキャピタルマーケット責任者であるMichael Harris氏は、インフォメーションズ・プライベートキャピタル・カンファレンスで、ほとんどの
続きを読むOpenAIが昨年末発表していたGPT-4 TurboがChatGPT(有料版)で使えるようになったとのことで試してみました。GPT-4からのアップグレードであるGPT-4 Turboは、数学、論理的推論、コーディング、
続きを読む企業のAI導入に対する姿勢について、いくつかの傾向が明らかになったようです。 現在、FRBが高金利政策を維持しているため、企業を取り巻くマクロ経済環境は厳しい状況にあります。そうした中、企業のIT予算は限られており、20
続きを読むHugging Face上で試せる文字起こしツール「Whisper Web」を試してみました。このサービスは、Webブラウザ上で利用できる音声認識ツールで、手軽に音声データを文字に変換できます。GitHubのリポジトリか
続きを読むAmazonは4月11日、著名なコンピューター科学者であるAndrew Ng氏を取締役に迎えると発表しました。Ng氏はGoogleやBaiduでAIプロジェクトを率いた経験を持ち、現在はスタンフォード大学で客員教授を務め
続きを読むフランスのAIスタートアップ企業であるMistral AIが、大規模言語モデル(LLM)「Mixtral 8x22B」を静かにリリースしました。このモデルは、同社のこれまでの発表の仕方と同様、X(旧Twitter)上で詳
続きを読む