Metaが新たにリリースしたLlama3を搭載したmeta.aiを試してみました。残念ながら、現時点では日本語に完全には対応していないようで、大部分は英語で試すことになりました。 筆者は主に要約や文章生成のタスクを試して
続きを読む
Metaが新たにリリースしたLlama3を搭載したmeta.aiを試してみました。残念ながら、現時点では日本語に完全には対応していないようで、大部分は英語で試すことになりました。 筆者は主に要約や文章生成のタスクを試して
続きを読む新しくリリースされたAIアシスタント「Reka」を試してみました。Rekaは、先日ご紹介した通り、DeepMind、Google、Metaの元研究者たちによってベイエリアで設立されたAIスタートアップです。非常に短期間で
続きを読むまた新たに強力なAI企業が現れました。Reka AIが、新たなマルチモーダル言語モデル「Reka Core」を発表しました。 Reka Coreは、画像、音声、動画、テキストなど、マルチモーダルな入力を理解することができ
続きを読むAdobe社は、生成AI(genAI)を活用した新たな映像編集ツールの提供を開始すると発表しました。同社の「Firefly AI」を搭載したこれらのツールは、Adobe Premiere Proをはじめとする主要ソフトウ
続きを読むx.AIは言語モデル「Grok」の新しいアップグレード版「Grok-1.5Vision」を発表しました。このバージョンはテキストだけでなく、図表やドキュメント、チャートなど様々なタイプの視覚データを理解し処理する「マルチ
続きを読む新しい音楽生成AI「Udio」を紹介します。 Udioで制作された楽曲を聴いてみると、その高い質に驚かされます。現時点では、競合のSunoで作られた楽曲の方がまだ一歩リードしているように感じますが、Udioはまだリリース
続きを読む最近、大規模言語モデル(LLM)の新しいバージョンの発表が相次いでいます。全てを紹介することはできませんが、主要な動きをまとめてみたいと思います。 まず、GoogleとOpenAIが、すでに発表されていたモデルを一般から
続きを読むOpenAIが昨年末発表していたGPT-4 TurboがChatGPT(有料版)で使えるようになったとのことで試してみました。GPT-4からのアップグレードであるGPT-4 Turboは、数学、論理的推論、コーディング、
続きを読むHugging Face上で試せる文字起こしツール「Whisper Web」を試してみました。このサービスは、Webブラウザ上で利用できる音声認識ツールで、手軽に音声データを文字に変換できます。GitHubのリポジトリか
続きを読むフランスのAIスタートアップ企業であるMistral AIが、大規模言語モデル(LLM)「Mixtral 8x22B」を静かにリリースしました。このモデルは、同社のこれまでの発表の仕方と同様、X(旧Twitter)上で詳
続きを読むプレゼンテーション生成ツール「Tome」を試してみました。プレゼンツールの中で注目されていてPowerPointに慣れていない若い世代を中心に支持を集めているようです。こちらは先日ご紹介したGammaと同じコンセプトのツ
続きを読むカナダ・トロントに本社を置くCohereが先日発表した大規模言語モデル(LLM)「Command R+」が、オープンソースのLLMの中でトップに躍り出ました。LMSYSのリーダーボードでは、OpenAIのGPT-4やAn
続きを読む