画像生成AIのスタートアップであるIdeogramが、新しい無限ワークスペース機能の「Canvas」を発表しました。Canvasは、画像の整理、生成、編集、結合を1つのプラットフォームで行える「無限キャンバス」として設計
続きを読むAnthropicのClaudeに新たなJavaScript分析ツールが追加
AnthropicのAIアシスタント「Claude AI」に、新たにJavaScriptコードを自動生成・実行できる「分析ツール」が導入されました。このツールは、Claude AIのチャットインターフェース内で直接Jav
続きを読む
【資金調達:シリーズC】Waymo、過去最大の56億ドル資金調達で自動運転事業を加速
Googleの親会社Alphabetの自動運転車部門であるWaymoは、このたび過去最大となる56億ドル(約8,512億円)のシリーズC資金調達を完了しました。この資金調達はAlphabetが主導し、Andreessen
続きを読む
動画生成のRunway「Act-One」:キャラクターに感情を吹き込む革新的技術
Runwayが新たに発表した「Act-One」は、同社のGen-3 Alphaモデルの一環として登場した画期的な技術です。通常のカメラで撮影した映像と参照画像があれば、人物の表情をAIキャラクターに驚くほど自然に反映させ
続きを読むElevenLabsのVoice Design 2.0:自在にキャラクターのAI音声を生成
ElevenLabsが先日発表した音声生成機能「Voice Design 2.0」は、テキストプロンプトを使用して独自のAI音声を生成できる画期的な機能です。ユーザーは音声の年齢、アクセント、トーン、キャラクター性などを
続きを読む
Google DeepMindが透かし技術「SynthID」をオープンソース化
Google DeepMindは、AIが生成したコンテンツを識別しやすくするための高度な透かし技術「SynthID」をオープンソース化しました。この技術では、テキスト、画像、音声、動画といったAI生成コンテンツに、目に見
続きを読むGenmo、オープンソースのAIビデオ生成モデル『Mochi 1』を発表
動画生成AIの分野で新しいオープンソースモデルが公開されました。Genmoが発表した「Mochi 1」は、100億のパラメーターを持つオープンソースのテキストからビデオを生成するAIモデルで、Apache 2.0ライセン
続きを読むAI画像生成の最新版「Stable Diffusion 3.5」登場 – カスタマイズ性と多様性が大幅に向上
Stability AIは2024年10月22日、画像生成AIの最新版「Stable Diffusion 3.5」を発表しました。このバージョンは以前のものと比較して、パフォーマンスと多様性が大幅に向上しているのが特徴で
続きを読む
Anthropic、革新的な「Computer Use」機能を発表 – Claude 3.5の大幅アップグレードも
Anthropicは最近、AIがコンピューターを直接操作できる革新的な機能「Computer Use」のパブリックベータ版を発表しました。この機能により、AIは自律的にパソコン上でカーソルの移動やクリック、テキスト入力な
続きを読むイーロン・マスクのxAI、Grokモデルのパブリックベータ版APIをリリース
イーロン・マスク率いるxAIは最近、Grok言語モデルをサードパーティアプリケーションに組み込めるAPIのパブリックベータ版を公開しました。 現在利用できるモデルは「grok-beta」のみですが、将来的には「Grok-
続きを読むMicrosoftがCopilotとDynamics 365に自律型AIエージェント機能を追加へ
マイクロソフトは、企業向けAIツール「Copilot」と業務管理システム「Dynamics 365」に、新しい自律型AIエージェント機能を追加すると発表しました。この機能は2024年11月から使えるようになります。 今回
続きを読む
Meta、AIの新モデルとデータセットを次々と発表 – 音声言語モデルやLLM高速化技術など
MetaのAI研究チームであるFAIRは、AIの性能向上や応用範囲の拡大に貢献するいくつかの研究成果を発表しました。 まず、画像セグメンテーションツール「Segment Anything Model (SAM)」の改良版
続きを読む