Meta发布可执行多种任务的语音模型Voicebox

新知榜官方账号

2023-10-01 22:48:19

Meta发布可执行多种任务的语音模型Voicebox

Meta最近发布了一款名为Voicebox的语音模型,可执行多种任务,如文本生成、语音降噪和编辑、跨语言风格生成等。该模型支持英语、法语、德语、西班牙语、波兰语和葡萄牙语6种语言,可以帮助用户更好地训练语音助手模型。

Voicebox突破了传统语音合成器的技术限制,使用全新方法学习文本和语音之间高度不确定的映射联系。它可以从不同的语音数据中学习,而无需仔细标记这些变化,因此可以在更大规模的数据集上进行训练。

该模型主要用途是帮助媒体人轻松编辑音轨,可以去除背景噪声、克隆声音、风格转换和多样化语音合成等。此外,Voicebox还可以生成6种自然语言的语音,可用于生成语音训练数据,帮助企业、个人开发者更好的训练语音助手模型。

据悉,Meta还在大语言、扩散、视觉切割、语音等领域,发布了很多功能强大的模型。扎克伯格表示,未来Meta的Instagram、Whatsapp、Messenger等招牌产品都会引入生成式AI功能,为用户提供文本生成、图片生成、AI聊天等服务,加大对生成式AI的布局。Voicebox的论文已经公开,但模型和代码暂不会开放,因为语音模型存在滥用的风险。不过,Meta已经构建了一个高效的分类器,可以区分使用Voicebox生成的真实语音和音频。

本页网址:https://www.xinzhibang.net/article_detail-14709.html

寻求报道,请 点击这里 微信扫码咨询

关键词

Meta Voicebox 语音模型 文本生成 语音合成 多语言

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯