Meta发布AudioCraft开源人工智能工具,可根据文本提示创作音乐和音频

新知榜官方账号

2023-08-03 08:38:18

Meta在美东时间周三发布了一款开源人工智能工具AudioCraft(直译为音频技艺),可用文本内容生成高质量、逼真的音频和音乐。这款工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,其中MusicGen可以从文本提示生成音乐,AudioGen则可以从文本提示生成音效,比如模拟狗叫或脚步声。再加上EnCodec编解码器的改进版本,用户可以更高效率地生成更高质量的音乐。

Meta还演示了MusicGen和AudioGen工作的流程图,并表示将让这些模型开源,让研究人员和从业人员可以用自己的数据集训练适合自己的模型,并帮助推进人工智能生成音频和音乐领域的发展。与其他音乐模型相比,AudioCraft系列模型能够生成长期一致的高质量音乐和音频,还简化了音频生成模型的整体设计,使得该工具简单易用。

Meta相信它的模型可以引领新一波歌曲潮流,就像合成器改变音乐一样。

今年早些时候,谷歌也发布了名为MusicLM的音乐生成模型,并于5月向所有用户开放。除此之外,目前较为常见的音乐模型还有Riffusion、Mousai和Noise2Music等。

本页网址:https://www.xinzhibang.net/article_detail-9152.html

寻求报道,请 点击这里 微信扫码咨询

关键词

Meta AudioCraft 开源人工智能工具 音乐 音频

分享至微信: 微信扫码阅读

相关文章