研究人员开发出端到端机器学习系统，可以从音频中单独生成实时面部动画

新知榜官方账号

2023-10-13 02:46:40

浙江大学和网易伏羲AI实验室的研究人员开发出一个名为Audio2Face的端到端机器学习系统，可以从音频中单独生成实时面部动画，并调节音调和说话风格。该团队试图构建一个同时满足“逼真”（生成的动画必须反映可见语音运动中的说话模式）和低延迟（系统必须能够进行近乎实时的动画）要求的系统。他们还尝试将其推广，以便可以将生成的动画重新定位到其他3D角色。

该系统的实现基于音轨设计，没有任何其他辅助输入（例如图像），这就使得当我们试图从声音序列中回归视觉空间的过程将会越来越具有挑战。此外，该系统可以消除说话人随时间变化的面部动作，从而产生准确的唇部运动。

Audi2Face的实现基于从原始输入音频中提取手工制作的高级声学特征，特别是梅尔频率倒谱系数（MFC），或声音的短期功率谱的表示。然后深度相机与mocap工具Faceshift一起，捕捉配音演员的面部动作并编制训练集。最后，该团队构建了带有51个参数的3D卡通人脸模型，控制了脸部的不同部位（例如，眉毛，眼睛，嘴唇和下巴），并利用上述AI系统将音频上下文映射到参数，产生唇部和面部动作。

该成果已经发布至arXiv，共同作者解释道：“另一个挑战是面部活动涉及脸部几何表面上相关区域的多重激活，这使得很难产生逼真且一致的面部变形。”评估结果显示，该框架可能为适应性强、可扩展的音频到面部动画技术奠定基础，这些技术几乎适用于所有说话人和语言。

本页网址：https://www.xinzhibang.net/article_detail-16636.html

寻求报道，请

关键词

分享至微信：

相关工具

Rask

AI视频本地化解决方案

Lumen5

AI将博客文章转换成视频

Gencraft

AI艺术画视频生成工具

Cutout.Pro

AI在线处理图片

AVCLabs

AI自动移除视频背景

Colourlab.ai

好莱坞也在用的AI视频颜色分级工具

大模型创业者的挑战与机遇

背景去年末，搜狗原CEO王小川只是体验了几次ChatGPT，就确信“AGI已经来了”。后来在创业者社区的一次线上交流会上，当几位AI领域的创业者仅从功能上定义ChatGPT的进步时，王小川又明确表态“大家把这件事想小了。”坚信ChatGPT能颠覆世界的，不止王小川一人。“这并不是上一代的AI技术”，

分类标签大模型创业AI商业化落地

12-04 16:08

使用仙宫云跑SD，用户体验至关重要！

使用仙宫云进行SD渲染最近我在用SD做AI视频。家里的3060真的实在是扛不住了，实在太慢，渲染个几秒钟的动画都要几十分钟甚至一个小时。还是上云吧。其实自己以前一直是本地跑，没怎么用过云端SD，不用不知道，一用吓一跳。我自认为算是稍微专业一点的SD玩家了。还是被各种云折磨的死去活来。比如所谓的阿X云

分类标签 SD云端GPU算力租赁

11-23 02:15

AI数字人：从娱乐场景到产业应用的转变

2022年是AIGC的元年，得益于大模型、多模态和数字孪生等技术的进步，AIGC被提到前所未有的高度，被称为是人工智能领域近期最大的跃进之一。随着AIGC颠覆内容生产模式，市场对于内容的要求也从简单的输出逐渐提高到内容丰富度和准确度，AI赋能内容生产正在向更低的成本，更快的速度发展。无独有偶，同年年

分类标签 AIGCChatGPTAI数字人内容生成企业价值

11-16 08:40

浅谈内部CRM的SFA建设

浅谈内部CRM的SFA建设内部CRM是企业重要的管理工具之一，而SFA建设则是内部CRM中的重要组成部分。SFA（Sales Force Automation）是指销售自动化，是通过计算机和网络技术，将销售业务中各个环节进行标准化处理、自动化管理，以提高销售效率、降低销售成本、提高服务质量的一种管理

分类标签内部CRMSFA建设市场

11-07 08:02

机器人客服的崛起和普及

机器人客服的崛起和普及随着人工智能技术的不断发展和普及，机器人客服正逐渐成为企业服务的新宠。这些智能机器人具备语音识别、自然语言处理等功能，可以实现与客户的智能对话，提供快速、准确的解决方案。相比传统客服，机器人客服更加高效、便捷，让用户享受到了全天候、无延迟的服务体验。情感识别技术的应用为了提升机

分类标签机器人客服情感识别技术跨界合作AI语音助手虚拟形象多语言支持

10-29 22:20

基于学习的动画制作方法：基于卡通角色的少量图像样本就可生成新动画

背景介绍相比于依靠创作者手绘的动画，木偶动画的制作是个非常繁琐的过程，我们需要将一个动作分解成若干个环节，逐帧拍摄再连续放映为影片。近日，Adobe和康奈尔大学提出了一种名为「变形木偶模板」的动画制作方法，可实现基于少量卡通角色样本生成新角色动作，和木偶动画的制作方法倒是有异曲同工之妙。传统动画制作

分类标签动画制作变形木偶模板卡通角色图像样本学习渲染

10-13 02:48

NVIDIA研究团队推出“黑科技”：仅需一个音频即可快速生成表情丰富的虚拟数字人

虚拟数字人面临表情和互动不够自然的困境随着元宇宙概念的大热，以及疫情叠加下人们对数字生活需求的增加，虚拟数字人的发展步入了快车道，出现了很多类似于华智冰、柳夜熙、翎Ling等超写实虚拟数字人。而人与这些虚拟数字人最大的区别是有感情、能够体会到喜怒哀乐，且能够把喜怒哀乐实时地通过语言、表情等来体现。而

分类标签 NVIDIA虚拟数字人音频表情丰富AI技术Omniverse

10-13 02:44

迪士尼研究AI生成动画技术

迪士尼研究AI生成动画技术近日，迪士尼研究所和罗格斯大学的科学家共同发表了关于AI文本生成动画模型的论文。这种算法只要在输入的文本中描述某些活动即可，不需要注释数据和进行大量训练就能产生动画。这篇论文中，研究人员进一步提出了端到端模型，这种模型可以创建一个粗略的故事版和电影剧本的视频，用来描绘电影剧

分类标签迪士尼AI动画

10-13 02:42

华安证券“勇毅前行”2023年夏季上市公司交流会举行

华安证券“勇毅前行”2023年夏季上市公司交流会举行8月23日至24日，华安证券“勇毅前行”2023年夏季上市公司交流会在上海举行，来自计算机、电子、通信、军工、医药等20个行业的近200家龙头企业参加，就AI的未来与周期律动等前沿热门话题展开探讨。在8月23日主题“AI的未来：布局与应用”研讨会上

分类标签华安证券AI周期律动

10-13 02:30

环球音乐与YouTube合作打造音乐AI孵化器，为何环球音乐开始拥抱AI？

YouTube宣布与环球音乐合作，打造音乐AI孵化器，双方携手可以说是强强联合。首批参与者有女歌星Anitta、OneRepublic乐队主唱RyanTedder、说唱歌手YoGotti、作曲家MaxRichter等十多个人，他们都是环球音乐旗下的艺术家。环球音乐集团董事长兼CEO表示，人工智能永远

分类标签环球音乐YouTubeAI音乐音乐AI孵化器音乐产业人工智能

10-10 22:34