AI音乐生成模型MusicGen开源，能否成为优秀的音乐生成模型？

新知榜官方账号

2023-07-08 06:24:33

从AI孙燕姿到MusicGen，从演唱到创作，AI已经全面入侵音乐领域。近日，Meta在Github上开源了AI模型MusicGen，引发外界关注。

顾名思义，MusicGen是有一个音乐生成AI模型，可以根据文本和旋律提示创作音乐。该模型基于谷歌2017年推出的Transformer模型，并采用Meta的EnCodec编译器将音频数据分解为小单元处理。

上周晚些时候，Meta人工智能研究工程师FelixKreuk在Twitter上展示了MusicGen的功能。在视频演示中，MusicGen分别将两个古典音乐片段改编成80年代的流行音乐和现代嘻哈音乐，它还根据提示加入了乐器、电子音等元素。

根据Meta的介绍，MusicGen接受了20000小时的音乐训练，相当于人不吃不喝不睡觉训练833天。该模型还使用了来自媒体内容服务商ShutterStock和Pond5的音乐库。

那么，练习时长两年半的MusicGen，够格出道吗？Meta自己将MusicGen与市面上已有的音乐创作软件MusicLM（谷歌旗下）、Riffusion以及Mousai进行了比较。提示1.创作一首流行舞曲，要求旋律朗朗上口，加入热带打击乐因素，节奏欢快，适合沙滩场景。提示2.编一首气势宏伟的管线交响乐曲，加入雷鸣般的打击乐器、有史诗感的铜管乐和高昂的弦乐，创造一个适合英雄战斗的电影背景音乐。提示3.创作一首经典雷鬼音乐，加入电吉他独奏。不难听出，MusicGen的表现似乎更加惊艳。

据Meta称，无论在与文本的匹配度上，还是在作曲的可信度上，MusicGen在四者之间的表现都更胜一筹。为了验证MusicGen是不是真有那么好，科技媒体Techcrunch记者KyleWiggers亲身试用了MusicGen和MusicLM，对比两位AI音乐家的作品。先说他的结论：我得说，（MusicGen）还不至于让人类音乐家丢了工作，但它创作的音乐相当优美，至少对于“环境音乐”这样的基本提示语来说是这样，而且在我听来，它与谷歌的AI音乐生成器MusicLM相比，不分伯仲（如果不是稍微好一点的话）。

值得一提的是，目前市面上存在许多文本、语音、图片甚至是视频生成模型，但优质的音乐生成模型少之又少。根据在线科学预印本存储库arXiv中找到的研究文件，音乐生成的主要挑战之一是需要运行全频谱，这需要更密集的采样，更不用说复刻音乐的复杂结构和乐器的配合了。MusicGen能否成为一款优秀的音乐生成模型，还有待更多用户的验证。

用户可以通过HuggingFace的API体验MusicGen，但生成音乐可能需要一些时间，具体取决于同时在线的用户数量。目前，Meta尚未提供用于训练模型的代码，但提供了预训练模型。

本页网址：https://www.xinzhibang.net/article_detail-6780.html

寻求报道，请

关键词

分享至微信：

相关工具

Typecast

在线AI文字转语音生成工具

Boomy

AI音乐生成工具

Voicemod

AI变声工具

MetaVoice

AI实时变声工具

听悟

阿里推出的AI会议转录工具，万语千言，心领神悟

Audo Studio

AI音频清洗工具（噪音消除、声音平衡、音量调节）

英语听力练习：The Office - Cut It Out

欢迎关注我，每日分享优质英语听力！本文提供了一段The Office的对话，通过三个步骤进行听力练习，并提供了听力技巧。 Step 1: 盲听。先把整个音频全听完，这个过程先不要看文本，为更好地练习听力。本音频制作成3遍：第1遍：慢速播放对话，这一遍旨在听懂文章大意，不需要听懂每个单词，记录下自己没

分类标签英语听力练习TheOfficeCutItOut对话学习

12-01 16:21

MÜNN 2021秋冬系列：以“CUTOUT/抉”为主题的韩国民族服装文化与街头潮流的完美融合

MÜNN 2021秋冬系列：以“CUTOUT/抉”为主题的韩国民族服装文化与街头潮流的完美融合MÜNN是近年于欧洲备受注目的韩国品牌之一，品牌设计师Hyun-minHan在2021秋冬系列以“CUTOUT/抉”为主题，优雅地破坏衣服本来的形态，以一贯擅长的解构技巧，将传统的韩国民族服装文化融入街头潮

分类标签 MÜNN韩国品牌2021秋冬系列

12-01 16:20

2023年11月第4波干货合集推荐设计和艺术相关网站和AI工具

2023年11月第4波干货合集推荐设计和艺术相关网站和AI工具大家好，这是2023年11月的第4波干货合集！本文推荐了3个值得收藏的设计和艺术相关的网站，以及3个AI相关的工具。1、内容超全的当代线上艺术档案馆https://www.ubu.com/UbuWeb是一个内容极为丰富的、内里界限模糊的前

分类标签干货合集设计艺术网站AI工具

11-30 22:10

音乐人的“噩梦”？StabilityAI推出音乐生成工具StableAudio

背景StabilityAI推出了一款音乐生成工具StableAudio，它采用了“潜在扩散模型”，用户只需要输入关键词，就可以一键生成音频。StableAudio可以生成长达90秒的音乐，而其他模型通常只能生成几秒钟的音频片段。这一创新是通过潜在扩散技术实现的，StableAudio的模型可以逐渐减

分类标签 StabilityAIStableAudio音乐生成工具

11-17 22:19

中国式浪漫

中国式浪漫中国式的浪漫有着独特的韵味，充满了婉约而华贵的情感。从古至今，我们常常可以看到一些文艺作品中描绘的恋人们穿越古代的长廊，相互倾诉着深情而含蓄的爱意。这种浪漫，不单单是一种场景的表达，更多的是一种文化的传承。在现代社会中，这种东方之美依然在中国式的爱情中得以体现。例如，现代新人在婚礼上常常选

分类标签中国式浪漫东方之美传统与现代的碰撞

10-27 02:18

触站AI：让你轻松绘画的AI软件

一、什么是触站AI？触站AI是触站原创画师作品分享平台旗下的AI绘画系统。它使用了最新的AI技术，可以通过添加描述脑海中的画面，选择原画、漫画、游戏CG、科技幻想等风格，添加辅助词语：动作、服饰、表情及其他图片参考，生成出不同形状的图片，同时还能够生成与你描述内容相对应的笔刷。这使得触站AI成为了一

分类标签触站AIAI绘画人工智能软件

10-23 03:20

文心·一格：百度推出的AI作画平台

文心·一格：百度推出的AI作画平台文心一格是百度基于飞桨和文心大模型技术创新推出的AI作画平台，可实现AI辅助创作。该平台在2022年8月19日的中国图象图形大会CCIG2022正式发布，是首款产品。MuseArtMuseTransfer的延伸区MuseArtMuseTransfer是为创作者而建的

分类标签文心一格AI作画百度

10-23 03:18

音乐创业公司Riffusion完成400万美元新一轮融资

近日，音乐创业公司Riffusion完成了价值400万美元的新一轮融资，本轮融资由GreycroftPartners领投，SouthParkCommons和Sky9参投。该轮资金将用于进一步开发人工智能技术，生成原创音乐。Riffusion最初是作为一个免费开源工具创建，它通过使用AI，将简单的文本

分类标签 Riffusion人工智能技术原创音乐

10-22 23:22

昆仑万维旗下StarXMusicXLab发布五首由AI生成的歌曲

昆仑万维旗下StarXMusicXLab发布五首由AI生成的歌曲音乐实验室是昆仑万维以人工智能应用场景落地为方向，以AI音乐生成为主要研究方向成立的机构，依托成熟专业的全链路音乐制作和海外发行能力，向全球输出高质量单曲、配乐、氛围音乐。据介绍，StarXMusicXLab音乐实验室的AI作曲技术拥有

分类标签昆仑万维StarXMusicXLabAI生成歌曲

10-18 09:08

中央音乐学院举办“面向未来——电子音乐与AI的交响”音乐会

中央音乐学院举办“面向未来——电子音乐与AI的交响”音乐会中央音乐学院举办了“面向未来——电子音乐与AI的交响”音乐会，是国内首场深度融合AIGC、3D音频、脑科学等前沿科技的音乐会。音乐会由中央音乐学院院长俞峰担任艺术总监，中国科学院院士管晓宏担任AI技术总监，中央音乐学院音乐人工智能与音乐信息科

分类标签中央音乐学院电子音乐人工智能

10-18 09:06

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway