Googleの親会社Alphabetの自動運転車部門であるWaymoは、このたび過去最大となる56億ドル(約8,512億円)のシリーズC資金調達を完了しました。この資金調達はAlphabetが主導し、Andreessen
続きを読む動画生成のRunway「Act-One」:キャラクターに感情を吹き込む革新的技術
Runwayが新たに発表した「Act-One」は、同社のGen-3 Alphaモデルの一環として登場した画期的な技術です。通常のカメラで撮影した映像と参照画像があれば、人物の表情をAIキャラクターに驚くほど自然に反映させ
続きを読むElevenLabsのVoice Design 2.0:自在にキャラクターのAI音声を生成
ElevenLabsが先日発表した音声生成機能「Voice Design 2.0」は、テキストプロンプトを使用して独自のAI音声を生成できる画期的な機能です。ユーザーは音声の年齢、アクセント、トーン、キャラクター性などを
続きを読むGoogle DeepMindが透かし技術「SynthID」をオープンソース化
Google DeepMindは、AIが生成したコンテンツを識別しやすくするための高度な透かし技術「SynthID」をオープンソース化しました。この技術では、テキスト、画像、音声、動画といったAI生成コンテンツに、目に見
続きを読むGenmo、オープンソースのAIビデオ生成モデル『Mochi 1』を発表
動画生成AIの分野で新しいオープンソースモデルが公開されました。Genmoが発表した「Mochi 1」は、100億のパラメーターを持つオープンソースのテキストからビデオを生成するAIモデルで、Apache 2.0ライセン
続きを読むAI画像生成の最新版「Stable Diffusion 3.5」登場 – カスタマイズ性と多様性が大幅に向上
Stability AIは2024年10月22日、画像生成AIの最新版「Stable Diffusion 3.5」を発表しました。このバージョンは以前のものと比較して、パフォーマンスと多様性が大幅に向上しているのが特徴で
続きを読むAnthropic、革新的な「Computer Use」機能を発表 – Claude 3.5の大幅アップグレードも
Anthropicは最近、AIがコンピューターを直接操作できる革新的な機能「Computer Use」のパブリックベータ版を発表しました。この機能により、AIは自律的にパソコン上でカーソルの移動やクリック、テキスト入力な
続きを読むイーロン・マスクのxAI、Grokモデルのパブリックベータ版APIをリリース
イーロン・マスク率いるxAIは最近、Grok言語モデルをサードパーティアプリケーションに組み込めるAPIのパブリックベータ版を公開しました。 現在利用できるモデルは「grok-beta」のみですが、将来的には「Grok-
続きを読むMicrosoftがCopilotとDynamics 365に自律型AIエージェント機能を追加へ
マイクロソフトは、企業向けAIツール「Copilot」と業務管理システム「Dynamics 365」に、新しい自律型AIエージェント機能を追加すると発表しました。この機能は2024年11月から使えるようになります。 今回
続きを読むMeta、AIの新モデルとデータセットを次々と発表 – 音声言語モデルやLLM高速化技術など
MetaのAI研究チームであるFAIRは、AIの性能向上や応用範囲の拡大に貢献するいくつかの研究成果を発表しました。 まず、画像セグメンテーションツール「Segment Anything Model (SAM)」の改良版
続きを読むGoogleのAI組織再編:DeepMindの権限強化と新体制で加速するAI開発
Googleは、AI分野での競争力強化に向けた大規模な組織再編と人事異動を発表しました。今回の再編では、主に3つの大きな変更が行われています。 1つ目は経営幹部の交代です。長年検索・広告部門を率いてきたプラバカール・ラガ
続きを読むChatGPTのアクセス数が9月に31億回超え、世界で11番目のサイトに
2024年9月、OpenAIのChatGPTは31億回のアクセスを達成しました。これは前年同月比で112%の増加であり、8月からも18.7%の伸びを示しています。この急成長により、ChatGPTは世界で11番目に訪問者数
続きを読む