Stability AIは米国時間9月13日、生成AI技術を活用し、プロンプトに基づいて音楽や音響効果を生成する、「Stable Audio」をリリースした。これに先立ち、GoogleやMetaなど他の業界大手企業も類似の技術を発表している。
無料の「Free」プランでは、45秒までの非商用トラックを1カ月に20件生成できる。
仕事でこのツールを利用するなら、月額11.99ドル(約1800円)の「Professional」プランへの加入を検討するといい。このプランでは、商用ライセンス付きの90秒までのトラックを1カ月に500件生成できる。
Stability AIはこのAIツールについて、音楽に組み込むサンプルを作成したい音楽家にとって特に有用だとしている。
Stable AudioのFreeプランは、ウェブサイトでサインインするだけで試用できる。
ただし、現在はトラフィック集中のため、利用中に空白のページが表示されることがある。その場合は翌日にまた試すよう、Stability AIは推奨している。
サインインしたら、生成したい音声に関するテキストプロンプトを入力するだけで、約15秒後に結果が出力される。
プロンプトを入力する際には、最良の結果が得られるように、ジャンル、雰囲気、長さ、BPMなど、多くの情報を含めることができる。
Stability AIはプロンプトの例として、「Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw, Epic, Sentimental, 125 BPM」(ポストロック、ギター、ドラムキット、バス、弦楽器、多幸感、高揚感、物悲しさ、流れるように、粗野、壮大、感情的、125BPM)や、「car passing by」(通り過ぎる車)などシンプルなものを挙げている。
筆者は「Happy, beachy, mellow country track」(ハッピー、波際、メロウなカントリートラック)と入力して、まさに求めていた雰囲気をまとったその出力に感銘を受けた。生成したトラックは、mp3ファイルとしてダウンロードできる。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」