2021年に創業した中国・上海に本拠を置く AI スタートアップの MiniMax が「 Speech-02 」をリリースしました。Speech-02 はテキストから音声への変換( TTS: Text-to-Speech
続きを読む
2021年に創業した中国・上海に本拠を置く AI スタートアップの MiniMax が「 Speech-02 」をリリースしました。Speech-02 はテキストから音声への変換( TTS: Text-to-Speech
続きを読むLuma Labsの新機能「Magic Doodles」をご紹介します。この機能は、ユーザーが描いた簡単な落書きやスケッチを、アニメーションや動画へと変換するものです。 Magic Doodlesは、同社の「Ray2 I
続きを読むニューヨークに本社を置く AI 動画生成スタートアップ Runway が、最新アップデートの「 Gen-4 」を 2025 年 3 月 31 日に発表しました。この新しいモデルは、特にキャラクターやシーンの一貫性と制御性
続きを読むAmazon AGI Labs が新たに発表した「 Nova Act 」は、ウェブブラウザを自律的に制御してタスクを実行できる AI エージェントシステムです。2025 年 3 月 31 日に発表されたこのシステムは、現
続きを読むGoogle の最新 AI モデル「 Gemini 2.5 Pro Experimental 」が、Mensa Norway の IQ テストで 130 というスコアを獲得し、AI 業界で注目を集めています。このスコアは
続きを読むAlibaba の Qwen チームが、新たな視覚的推論モデル「 QVQ-Max 」をリリースしました。このモデルは 72 億パラメータを持ち、単なる画像認識を超えて、画像や動画に含まれる視覚情報を分析し、論理的に推論す
続きを読むAlibaba Cloud は、新たなマルチモーダル AI モデル「 Qwen2.5-Omni-7B 」を発表しました。このモデルは、テキスト・画像・音声・動画といったさまざまな情報を同時に処理でき、リアルタイムで自然な
続きを読む元 Google の研究者らが設立した画像生成スタートアップの Ideogram が、 AI モデルの Ideogram バージョン 3.0 をリリースし、画像生成 AI の新たな基準を打ち立てました。 2025 年 3
続きを読むOpenAI の GPT-4o がネイティブに画像生成機能を実装したというニュースを受けて、早速試してみました。昨今の生成 AI の進化は目覚ましく、テキスト生成だけでなく画像生成の分野でも競争が激化していますが、GPT
続きを読むOpenAI は、ChatGPT の「 Advanced Voice Mode (主に英語版)」に対する改良を発表しました。今回のアップデートは 2025 年 3 月 24 日に公開され、AI アシスタントとの音声対話を
続きを読むOpenAI が GPT-4o モデルを利用した画像生成機能を発表しました。この新機能により、ChatGPT はテキストと画像を統合して、より正確で文脈に応じた画像を生成できるようになります。このアップデートは 2025
続きを読むGoogle が 2025 年 3 月 25 日に発表した最新 AI モデル「 Gemini 2.5 Pro 」(実験的バージョン)が、「 Chain-of-Thought (思考の連鎖)」機能を標準搭載した点で大きな注
続きを読む