Meta预览基于语音的生成AI模型Voicebox

新知榜官方账号

2023-10-11 18:00:30

Meta预览了一种基于语音的生成AI模型Voicebox,该模型可以将虚拟助手的声音换成您认识的人的声音,并生成高质量的音频剪辑,同时保留音频的内容和风格。该模型也是多语言的,可以用六种语言生成语音。

Meta表示,由于滥用的潜在风险,他们目前不会公开Voicebox模型或代码。但Meta的AI团队分享了音频样本和研究论文,详细介绍了他们迄今为止取得的成果。

在演示文本转语音功能的视频中,我们看到通过Voicebox运行的音频剪辑以六种不同的语音风格生成相同的短语。它还删除了狗在会议后台吠叫的音频,并在最终录制的版本中更改了一个词(“伙计们”到“每个人”)。而且,它需要某人用不同语言说某事的音频,并让该声音用英语说出来,使用他们的语音风格。

Meta正在专注于生成人工智能,以加强我们在这一领域的工作。该公司还在测试人工智能算法的使用,以帮助广告商为在线广告创建文本和图像。

据报道,无论公司想出什么,Meta都在追赶人工智能。如华尔街日报报道,Meta正在“争先恐后地”提出可以产生收入的人工智能产品,“在花费数年时间优先考虑学术发现并自由分享它们之后”。但也有障碍,许多从事人工智能工作的人去年离开了公司。

总的来说,Meta在人工智能领域取得了很大的进展,并且正在不断探索新的可能性。

本页网址:https://www.xinzhibang.net/article_detail-16394.html

寻求报道,请 点击这里 微信扫码咨询

关键词

Meta Voicebox 语音生成 人工智能 虚拟助手 音频剪辑

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯