Meta推出全新生成式AI模型Voicebox,普通人也能成为音频剪辑师

新知榜官方账号

2023-10-11 18:04:17

Meta推出全新生成式AI模型Voicebox,该模型帮助普通用户执行音频编辑、采样和风格化等语音生成任务,即便是视障人士也能轻松上手。

该模型可以生成高质量的音频剪辑,消除不必要的背景噪音,同时保留音频的内容和风格,同时使用多种语言,以六种语言生成语音。未来,该模型还可以在元宇宙游戏中为视觉助理或非玩家角色提供自然的声音。

与Vall-E、YourTTS等其他音频AI模型相比,Meta表示Voicebox更先进,在比较单词错误率和样式相似性时优于两种模型。虽然Voicebox仍在进行中,尚未向公众开放,但Meta表示它正在研究一种有效的方法来区分Voicebox生成的真实语音和音频,以避免可能的潜在危害。

本页网址:https://www.xinzhibang.net/article_detail-16395.html

寻求报道,请 点击这里 微信扫码咨询

关键词

Meta Voicebox AI模型 音频剪辑 语音生成

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯