StabilityAI推出StableAudio文本转音频生成式人工智能平台

新知榜官方账号

2023-11-01 08:40:12

最近,以Midjourney和StabilityAI为首的科技公司正在图像生成领域打得如火如荼。为了找到下一个业务增长点,StabilityAI将眼光投向音频生成领域,推出了一个名为StableAudio的文本转音频生成式人工智能平台。

StableAudio使用了扩散模型,和StabilityAI的拳头产品StableDiffusion使用的相同AI模型。用户可以使用它来生成歌曲或任何项目的背景音频。音频扩散模型通常会生成固定长度的音频,所以应用到音乐制作方面会受到限制,但StableAudio允许用户以不同的长度生成声音,需要在起始和结束时间周围添加文本元数据,并进行了相关训练。

StableAudio使用了80万多个音频文件的数据集以及来自股票音乐许可公司AudioSparx的文本元数据进行训练。这样的数据集可以帮助模型更好地理解音频和文本之间的关系,并生成更逼真的音频。

StableAudio有三种定价层次:免费版、专业版和企业版。用户可以根据自己的需求和预算选择不同的版本。StableAudio的潜在用途之一将是为播客或视频制作背景音乐,该平台也可以用于其他音频生成任务。

本页网址:https://www.xinzhibang.net/article_detail-18479.html

寻求报道,请 点击这里 微信扫码咨询

关键词

StabilityAI StableAudio 音频生成 扩散模型

分享至微信: 微信扫码阅读

相关文章