新しい音楽生成AI「Udio」を紹介します。 Udioで制作された楽曲を聴いてみると、その高い質に驚かされます。現時点では、競合のSunoで作られた楽曲の方がまだ一歩リードしているように感じますが、Udioはまだリリース
続きを読むカテゴリー: AI Tools
LLMの新バージョンが続々登場 – 商用モデルとオープンソースモデルの性能競争が加速
最近、大規模言語モデル(LLM)の新しいバージョンの発表が相次いでいます。全てを紹介することはできませんが、主要な動きをまとめてみたいと思います。 まず、GoogleとOpenAIが、すでに発表されていたモデルを一般から
続きを読む【TOOLS】GPT-4 Turbo(AIチャット:評価★★★★☆)
OpenAIが昨年末発表していたGPT-4 TurboがChatGPT(有料版)で使えるようになったとのことで試してみました。GPT-4からのアップグレードであるGPT-4 Turboは、数学、論理的推論、コーディング、
続きを読む【TOOLS】Whisper Web(文字起こし:評価★★★★☆)
Hugging Face上で試せる文字起こしツール「Whisper Web」を試してみました。このサービスは、Webブラウザ上で利用できる音声認識ツールで、手軽に音声データを文字に変換できます。GitHubのリポジトリか
続きを読むMistral AIがオープンソースLLM「Mixtral 8x22B」を公開
フランスのAIスタートアップ企業であるMistral AIが、大規模言語モデル(LLM)「Mixtral 8x22B」を静かにリリースしました。このモデルは、同社のこれまでの発表の仕方と同様、X(旧Twitter)上で詳
続きを読む【TOOLS】Tome(プレゼン生成:評価★★★★☆)
プレゼンテーション生成ツール「Tome」を試してみました。プレゼンツールの中で注目されていてPowerPointに慣れていない若い世代を中心に支持を集めているようです。こちらは先日ご紹介したGammaと同じコンセプトのツ
続きを読むCohereのCommand R+がオープンソースLLMのトップに
カナダ・トロントに本社を置くCohereが先日発表した大規模言語モデル(LLM)「Command R+」が、オープンソースのLLMの中でトップに躍り出ました。LMSYSのリーダーボードでは、OpenAIのGPT-4やAn
続きを読む【TOOLS】イルシル(プレゼン生成:評価★★★★☆)
先日ご紹介した「Gamma」をはじめ、アメリカ発のプレゼン生成ツールをいくつか試してみましたが、どれも使い勝手に不満が残りました。作成過程や修正機能が大雑把すぎて、実用的とは言えない印象です。 そこで今回は、国産のプレゼ
続きを読む【TOOLS】Gamma(プレゼン生成:評価★★★☆☆)
プレゼン資料作成を自動化してくれるツール「Gamma」を試してみました。使い方は非常にシンプルで、例えば、事前に用意した箇条書きのテキストを入力するだけで、AIがレイアウトやデザインを自動的に生成してくれます。時間をかけ
続きを読む【TOOLS】Krea AI(画像生成:評価★★★★☆)
無料のリアルタイムAI画像生成・拡張ツールであるKrea AIを試してみました。このツールは、画像を生成、アップスケール、拡張することができます。従来のtext-to-imageやその他の機能が無料で使えるのが魅力的です
続きを読む【TOOLS】Audiobox(音声生成:評価★★★☆☆)
先日OpenAIの音声クローニング技術に関するニュースが話題になりましたので、興味を持ち、先行して昨年末に発表されていたMetaの同様の技術、Audioboxを遅ればせながら試してみました。 Audioboxにはいくつか
続きを読む【TOOLS】Stable Audio 2.0(音楽生成:評価★★★☆☆)
先日、スタッフの離脱と資金繰りに直面し、組織としての存続の危機にあると報じられていたStability AIから、新たな音楽生成サービス「Stable Audio 2.0」がリリースされたので、、早速試してみました。 S
続きを読む