Meta的Audiocraft研究团队发布名为MusicGen的新开源语言模型

新知榜官方账号

2023-10-18 08:40:18

Meta的Audiocraft研究团队发布了一种名为MusicGen的新开源语言模型。该模型可以从文本中生成新的音乐,甚至可以适应现有的歌曲。遵循与ChatGPT音频类似的路径,MusicGen允许您指定所需的音乐风格,可选择添加现有旋律并单击“创建”按钮。大约160秒后,它会根据您的文本建议和旋律生成一段全新的音乐。

Facebook的HuggingFaceAI网站上的演示可让您描述您的音乐并提供示例,例如“80年代流行歌曲,背景是重鼓和合成器垫”。然后,您可以“调整”一首长达30秒的歌曲,并使用允许您选择特定曲目的控件。然后只需按下“创建”按钮并等待最多12秒即可创建高质量样本。

该团队使用了20,000小时的授权音乐进行训练。其中包括来自内部数据集的10,000条高质量音乐曲目,以及Shutterstock和Pond5曲目。为了使其更快,他们使用了Meta的32KhzEnCodec语音分词器。

MusicGen可以本机运行(建议使用至少具有16GBRAM的GPU),并提供从小型(3亿个参数)到大型(33亿个参数)的四种模型尺寸。大型模型最有可能产生复杂的音乐。

本页网址:https://www.xinzhibang.net/article_detail-17123.html

寻求报道,请 点击这里 微信扫码咨询

关键词

MusicGen 开源语言模型 音乐生成器

分享至微信: 微信扫码阅读

相关工具

相关文章