新知榜官方账号
2023-10-18 08:34:17
今年5月,一首由AI翻唱的孙燕姿的歌曲在全网疯传,引起了人们对AI对音乐产业的讨论。最近,StabilityAI推出了一款名为StableAudio的音乐生成工具,可能进一步威胁到音乐人的饭碗。
StableAudio使用“潜在扩散模型”,用户只需输入关键词,就可以一键生成音频。据称,该工具能根据用户输入的文本生成丰富多彩、高质量的音频,范围涵盖了音乐、对话、环境音和特效声等。
目前,StableAudio只有网页版,用户输入关键词后即可生成音频。StableAudio的运行速度虽然不是非常快,但据官方称,该工具能在不到一秒的时间内,使用NVIDIAA100GPU渲染出95秒的立体声音频,并且提供免费试用机会。除了免费试用,StableAudio还提供专业版和企业版订阅计划,用户可以根据需求选择不同的订阅计划,并享受更多的音乐生成次数和时长。
为了训练StableAudio,StabilityAI与音乐提供商AudioSparx合作,在超过800000个音频文件的数据集上进行了训练。StableAudio可以模仿不同音乐风格和乐器的声音,用户只需输入相应的描述,即可生成符合要求的音乐。尽管StableAudio在英文描述的识别能力较好,但在中文描述的识别上有些问题,只能抓住音乐风格的描述。
StableAudio的核心技术是潜在扩散模型,它可以生成长达90秒的音乐,相比其他模型只能生成几秒钟的音频片段,这给音乐的质量和连贯性带来了提升。StableAudio的推出引起了市场上一系列类似工具的尝试,比如可以将音乐转化为图片的MusicToImage,根据音乐风格生成声音的Riffusion,将文本转化为音乐的MusicLM等。
总体而言,StableAudio能够满足使用者对“文生音”的好奇心,适合对音乐创作无经验的新手,但懂音乐乐理和基础知识的玩家会更有优势。在这个数字时代,StableAudio不仅是一个AI工具,也是一个让音乐梦想成真、激发创意和情感的平台。人人都能成为音乐家的时代或许很快就会到来。
微信扫码咨询
相关工具
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49