AI技术让郭德纲讲英语相声走红,HeyGen背后的技术原理是什么?

新知榜官方账号

2023-11-10 16:15:20

AI技术让郭德纲讲英语相声走红

近日,一段AI技术合成的郭德纲讲英语相声的视频在各大社交平台上广泛传播。视频中,这位被称为“相声界泰斗”的顶级笑星,用一口流利的英语,在麻省理工大学说相声,引发网友关注。

视频中,郭德纲不仅英语发音准确,而且声音和说中文时一样风趣幽默,连嘴型都十分自然。有网友纷纷称赞这种语音转换是“没有翻译腔的真正翻译”,认为即使是真人配音也无法达到这样逼真的效果。

AI技术让视频“跨国”传播,让人不禁想起前段时间火遍全网的AI孙燕姿翻唱。AI孙燕姿是一种利用人工智能技术模仿新加坡歌手孙燕姿的声音和风格的虚拟歌手,它可以用孙燕姿的音色和唱腔来翻唱其他歌手的歌曲,达到接近原唱的效果。

HeyGen背后的技术原理是什么?

HeyGen是一家名叫诗云科技的中国公司,成立于2020年,他们最初致力于做AI数字人生成,创始人JoshuaXu曾在Snapchat担任主要工程师,负责机器学习领域。现在,HeyGen不仅可以让视频中的人物用不同语言说话,也支持40多种语言。这样就可以轻松地跨越语言障碍,与全球观众沟通。

HeyGen主要提供四项功能,可以让你用AI视频工具制作各种用途的视频,比如产品营销、内容营销、销售推广、学习培训等。你可以用HeyGen节省时间、金钱和精力,提高效率和效果。

在网站中,AIAvatar是最受欢迎的功能。用户只需录制一段大约2分钟左右的视频,等待几分钟,就能创建出自己的数字人形象,和真人相差无几。与以往常见的AI换脸软件不同,在HeyGen中,数字人打破了过去的刻板影响,不再是简单地模仿面部表情和肢体动作,而是能够惟妙惟肖地展示出人类的各种情感和神态。此外,用户还可以通过在线AI制作或上传图片来生成影像,这一功能可以让静态的照片焕发活力,甚至能够开口说话。

HeyGen背后的技术原理并不复杂。HeyGen中的文本翻译部分采用了GPT模型,语音转文字采用了whisper模型,声音克隆和新音频生成采用了so-vits-svc模型,最后的口型匹配采用了GeneFace++模型。通过整合优化这些开源模型,HeyGen才实现了当前流畅的一键中英文语音转换效果。

未来展望

随着AIGC时代的到来,AIGC技术将为创作者提供更高效、更智能的工具,协助他们解放生产力,投入更多精力进行创作。在这个过程中,创作者更需要敏锐的洞察力,灵活掌握新技术,积极探索新的创作方式和商业模式。随着相关技术的不断成熟,我们有理由期待会出现更多有趣的语音合成场景,给观众带来更加丰富多彩的视听娱乐体验。

本页网址:https://www.xinzhibang.net/article_detail-19559.html

寻求报道,请 点击这里 微信扫码咨询

关键词

AI技术 郭德纲 HeyGen 数字人形象 语音合成

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯