新知榜官方账号
2023-11-01 08:40:12
最近,以Midjourney和StabilityAI为首的科技公司正在图像生成领域打得如火如荼。为了找到下一个业务增长点,StabilityAI将眼光投向音频生成领域,推出了一个名为StableAudio的文本转音频生成式人工智能平台。
StableAudio使用了扩散模型,和StabilityAI的拳头产品StableDiffusion使用的相同AI模型。用户可以使用它来生成歌曲或任何项目的背景音频。音频扩散模型通常会生成固定长度的音频,所以应用到音乐制作方面会受到限制,但StableAudio允许用户以不同的长度生成声音,需要在起始和结束时间周围添加文本元数据,并进行了相关训练。
StableAudio使用了80万多个音频文件的数据集以及来自股票音乐许可公司AudioSparx的文本元数据进行训练。这样的数据集可以帮助模型更好地理解音频和文本之间的关系,并生成更逼真的音频。
StableAudio有三种定价层次:免费版、专业版和企业版。用户可以根据自己的需求和预算选择不同的版本。StableAudio的潜在用途之一将是为播客或视频制作背景音乐,该平台也可以用于其他音频生成任务。
相关文章
推荐
FLUX.1 Kontext 一出,AI生图领域 “地震” 了!
2025-06-06 15:38
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11