Meta发布最多功能的语音生成模型Voicebox,但暂不公开模型

新知榜官方账号

2023-10-11 18:06:25

Meta发布了最多功能的语音生成模型Voicebox。该模型可以使用仅为两秒的音频样本以不同风格生成语音,并且可以用六种语言进行语音输出,包括英语、法语、德语、西班牙语、波兰语和葡萄牙语。Voicebox还可以将文本转换成不同语言的版本,即使样本语音和文本语言不同。此外,Voicebox可以匹配文本转语音生成的风格,并可以用于编辑音频,例如消除狗叫声或远处汽车喇叭声的背景噪音。

Voicebox是一个多功能的生成模型,可应用于各种用例和应用程序。Meta表示,未来,像Voicebox这样的多功能生成模型可以为元宇宙中的虚拟助手和非玩家角色提供“自然流畅的声音”,为视障人士提供通过人工智能以他们的声音听到朋友发来的书面信息,为创作者提供新的工具,轻松创建和编辑视频的音轨,以及更多其他功能。

尽管Voicebox是一个研究项目,但Meta的首席执行官马克·扎克伯格认为,这个模型将会用于构建许多有趣的东西。不过,Meta目前不打算公开这个模型,因为他们担心可能会被滥用。Meta并没有公开发布代码或模型本身,而是分享了音频样本以及一篇详细介绍方法和结果的研究论文。

最近,美国议员致信扎克伯格,表达对Meta发布LLaMA的担忧。这个庞大的语言模型具有巨大的影响力,议员们请求关于Meta如何评估发布LLaMA的风险的信息,并采取了哪些措施来防止滥用该模型。参议员理查德·布卢门撒尔和乔希·霍利在信中写道:“即使是在生成式人工智能工具面向公众的短时间内,它们已经被危险地滥用了——这种风险在开源模型的情况下更加严重。”

除了Voicebox之外,还有一些免费的AI工具可供使用,例如一品AI工具导航、一品AI助手(免费ChatGPT)和一品AI画师(免费MidjourneyAI绘画)。

本页网址:https://www.xinzhibang.net/article_detail-16396.html

寻求报道,请 点击这里 微信扫码咨询

关键词

Meta Voicebox 语音生成模型

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯