MetaAI发布音频生成开发框架AudioCraft，支持多个音频生成模型

新知榜官方账号

2023-10-12 16:38:29

MetaAI发布音频生成开发框架AudioCraft，支持多个音频生成模型

在过去的几年里，我们看到了AI在图像、视频和文本生成方面的巨大进步。然而，音频生成领域的进展却相对滞后。MetaAI这次再为开源贡献重磅产品：AudioCraft，一个支持多个音频生成模型的音频生成开发框架。

AudioCraft简介

任何类型的音频都需要对不同尺度的复杂信号和模式进行建模。音乐可能是最具挑战性的音频类型，因为它由局部和长程模式组成，从一系列音符到具有多种乐器的全局音乐结构。利用AI生成连贯的音乐通常通过使用类似MIDI或钢琴卷的符号表示来实现。然而，这些方法无法完全捕捉到音乐中的表现细微差异和风格元素。为此MetaAI开源了AudioCraft，一个可以用来生成音频的框架。它支持一系列的模型，能够产生高质量的音频，并具有长期的一致性，用户可以通过自然界面轻松地与其进行交互。AudioCraft适用于音乐和声音生成以及压缩，所有这些都在同一个平台上进行。由于易于构建和重复使用，希望构建更好的声音生成器、压缩算法或音乐生成器的人可以在同一个代码库中完成所有操作，并在其他人已有基础上进一步发展。

AudioCraft支持的模型

AudioCraft由三个模型组成：MusicGen、AudioGen和EnCodec。MusicGen使用Meta拥有和特别许可的音乐进行训练，从文本输入生成音乐，而AudioGen则使用公开的音效进行训练，从文本输入生成音频。此外，还有改进版的EnCodec解码器，它可以生成更高质量的音乐，减少了人工制作的痕迹。简单来说，MusicGen就是文本生成音乐的模型，AudioGen就是文本生成任意音频的模型。另外的EnCodec是指利用神经网络的实时、高保真音频编解码器。

可以看到，对于AudioGen模型，只需要给一段文字即可生成音乐，而MusicGen模型则是一个描述即可生成音乐。

使用AudioCraft

AudioCraft依赖Python3.9和PyTorch2.0，需要先确保系统环境满足要求。可以通过pip安装升级，也可以使用anaconda安装。安装完之后使用很简单，可以通过导入相应的模块来调用相关的函数。

本页网址：https://www.xinzhibang.net/article_detail-16502.html

寻求报道，请

关键词

分享至微信：

扎心文案+AI插画=爆款！揭秘8万赞视频的制作全流程

又一个爆款诞生！今天拆解一个账号——@尴尬的老男人，内容很简单，最高一条近8万赞，但平均每条视频都有几百赞！他的视频看似就是几张图片配上一段音乐，却精准狙击用户对“生活氛围感”和“情绪价值”的深层渴望，再加上温暖色调、治愈配乐——每一帧都让人忍不住驻足回味。其实，这种视频的关键就是2个：扎心文案

分类标签

08-12 10:08

三个国外专业免费的调色网站

三个国外专业免费的调色网站无论制作视频、编辑图片，合适的色彩会让你的作品增加视觉冲击力，所以专业的调色技术价值非凡，一部电影或一部好的视频、图片海报，专业调色耗费少则上万，多则上百万，只是大家对专业调色这个行业知之甚少，今天网玩君就为大家分享三个国外专业免费的调色网站，记得收藏好，以后编辑视频、图片

分类标签调色网站免费

04-18 16:42

第六届中国国际工业设计博览会盛况空前

第六届中国国际工业设计博览会于11月30日至12月2日在武汉举行。本届博览会展览面积达2万平方米，参展企业超过300家，其中，参展国家级工业设计中心数量为历届最多。众多国内外行业龙头企业展示了多项“首台套”的硬核实力，为中国制造业向高端化、智能化、绿色化转型升级赋能。中铁宝桥集团展示了多个“国内首条

分类标签中国国际工业设计博览会工业设计创新成果中国制造业

04-18 16:42

知识分享查理芒格思考的独立性与决策的准确性

知识分享查理芒格思考的独立性与决策的准确性本文介绍了成功投资者必须具备独立思考和决策准确性，同时保持谦逊低调的心态，以及成功的关键因素之一——运气。同时，本文还分享了下周市场关注的行业和概念。一、知识分享查理芒格思考的独立性成功的投资者必须具备独立思考的能力，因为只有独立思考才能避免盲目跟风和投资决

分类标签独立思考决策准确性谦逊低调

04-18 16:42

阿里国际发布三款AI设计工具助力中国制造走向全球

阿里国际发布三款AI设计工具助力中国制造走向全球12月1日，在第六届中国国际工业设计博览会上，阿里国际数字商业集团（简称“阿里国际”）发布了3款设计生态工具：堆友、PicCopilot、鹿班AI。这3款产品具有AI绘画、AI模型创作、AI图像和视频处理等功能，用AI设计服务全球商家更轻松的做好本地市

分类标签 AI设计阿里国际数字商业集团

04-18 16:42

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway