专访|NextHuman数字人: 打造数字人工具“全家桶”

新知榜官方账号

2023-03-21 16:36:55

近日,随着超写实数字人“正义”走红网络,在业界再度掀起对数字人发展前景的热议。

“尊敬的各位代表委员,大家好!我是正义。如果您有关于报告中相关内容的问题,可以向我提问。”只见数字人栩栩如生的表情动作、清晰可见的发丝纹理……

  11.png

超写实数字人“正义”

在今年两会期间,代表委员们用手机扫描二维码,即可进入最高人民法院的虚拟发布大厅,经过人工智能深度学习的超写实数字人——“正义”即可为大家解读《2023年最高人民法院工作报告》。

据悉,这款科技感十足的人机交互式对话产品由国内数字人创作和应用先锋公司NextHuman(唯物科技)打造。其实,NextHuman在人工智能领域的探索不止于法治宣传,智能客服、电商直播、商业发布会、虚拟授课等都能看到NextHuman数字人的身影。

那么,NextHuman有哪些竞争优势、具备哪些特色功能?如何将火热的ChatGPT与数字人产品结合?AIGC技术要想实现广泛的商业化应用,关键要解决什么问题……针对这些问题,新知榜特别专访了NextHuman智能数字代言人白小绸。

微信图片_20230321163211.jpg 

本次的采访对象白小绸来头不小,可谓“无所不能”。作为NextHuman的数字员工,白小绸不仅能担任公司前台、讲解员、还能胜任客服、HR、运营工作等。此外,白小绸还是NextHuman的形象代言人,负责官方品宣出镜,比如各类海报、官方视频、PPT、官网、演示、活动等。

那么,本次作为新闻发言人的白小绸,会有怎样的表现呢,咱们往下看!

01

实施产品差异化竞争

构建“数字人三角矛盾”模型

新知榜记者:源于什么样的契机,使你们团队决定创立NextHuman?

NextHuman智能数字代言人白小绸:

之前很长一段时间,我们团队一直在移动端研发数字人建模和渲染技术,但是我们观察到最近几年,5G技术和显卡算力的不断提升,有望对数字人的感官体验做一个全面的升级;

12.gif 

加上近一两年内AIGC和通用大模型的快速发展,势必会对数字人产生巨大的加持作用。所以我们决定成立NextHuman,一款超写实的数字人创作和应用工具。

新知榜记者:

目前虚拟数字人领域的发展趋势如何?对此,NextHuman产品差异化是什么,或者说竞争优势是什么?

NextHuman智能数字代言人白小绸:

总的趋势,是从低写实到高仿真,从线性内容表达到实时智能互动,从单次营销诉求到持续运营需求。

面对这种发展趋势,我们对于虚拟数字人也有一些思考,提出了“数字人三角矛盾”模型,很少有数字人功能能够在“写实度”、“实时互动能力”、“持续可运营”三个维度同时拥有较高的得分。

13.jpg

比如一些用传统影视流程制作的虚拟数字人,很好看很写实,但是无法被驱动,可以称之为“不可编程”。这类虚拟数字人制作成本太高、限制住了长期高频持续性的输出内容,更难以进入到实现AI对话以及更新更快的发展阶段。对于这些有非常高虚拟数字人与内容制作水准的公司来说,这是一个很大的痛点和难点。

那么,NextHuman其实就是希望能够解决这个问题。一方面,不断通过自研的技术来提升数字人的感官效果,降低制作成本;另一方面,提供一系列的易用的工具链,让生产出来的虚拟数字人可以一站式地被应用出去,包括直播功能、视频制作工具、智能角色工具、元应用编辑共工具等。

目前有一些拥有影视级别数字人的头部公司正在和我们探讨合作,尝试把知名数字人IP迁移到我们的平台上进行后续的一系列应用,希望能解决这一行业痛点。

14.jpg 这是从产品定位上,我们就和国内所有做数字人的公司不一样,我们不是交付一个项目、一个单一技术,而是提供一个saas工具以及paas 底层。那我们的竞争力,也就是体现在从算法技术到工程化到产品化上的综合能力,少一个环节都无法支撑。所以,你从产品界面上会看到好几个工具入口,看着有点像Adobe的工具“全家桶”。

新知榜记者:发展至今,NextHuman用户量有多少,一般是哪些人使用?

NextHuman智能数字代言人白小绸:

目前注册用户量近两万,基本上都是内容创作者,有个人博主和个人主播,也有中小企业内的媒体、运营、编辑、广告策划等,这类用户主要使用NextHuman进行内容创作,包括直播和视频制作。

但其实不仅仅是内容创作者,因为随着我们发布了数字员工解决方案,有越来越多的B端应用场景产生,数字人客服、数字人销售、数字人内训师等新型的需求也开始落地。

15.jpg 新知榜记者:为什么NextHuman会选择直播场景成为切入点?智能化的虚拟数字人直播引擎,对直播场景的帮助有哪些?

NextHuman智能数字代言人白小绸:

直播是一个相对比较清晰的场景,而且对于体验和成本也相对可控。3D虚拟人最大的想象空间应该是在一个XR的环境里输出内容,而目前的直播观看端仍然是手机,所以也有很大的局限吧,不知道今年苹果的XR眼镜出来之后会不会有什么变化。

16.jpg 

至于虚拟数字人直播引擎,肯定是有很多优势的。首先,这个数字人便于管理,可以实现24小时无休;其次,数字人可以呈现丰富的直播视觉效果,比如随时换装,换环境等,对增强用户停留时间是有一定帮助的。

02

产品持续向消费级应用渗透

用户创作使用数字人愈发便捷

新知榜记者:在数字人领域,NextHuman产品所强调的“消费级”,在技术上是如何实现的,帮用户解决了什么问题?

NextHuman智能数字代言人白小绸:

我们这里说的消费级,更多是体现在使用的便捷性上。举一些例子:我们知道3D设计类软件通常是很复杂的,比如用传统管线制作一个写实数字人,可能要用到6,7个工具才能完成,但是在NextHuman里,可能30分钟就可以创作出写实度极高的个性化虚拟人;

17.jpg 在传统方式里,你要进一步用这个数字人生产内容和互动,那么一定需要配备一堆专业的3D美术和技术,还需要技术工程师做支撑,而这个领域内的人才成本都很高,但是用NextHuman,一站式都解决了,用视频剪辑举例,就是PR和剪映的差别;

我们还考虑了大部分用户没有高性能的机器,于是我们全程同步开发了云渲染版本,你在任一电脑上都可以使用。

如果从技术角度去描述,我们自研的voice2mouth算法,极大地降低了数字人开口说话的门槛。写实类数字人的嘴型驱动存在一定难度,因为要同时呈现准确的嘴型和仿真的肌肉感。目前,我们不仅可以实现对中英文自然说话的嘴型生成,还能够实现对唱歌的嘴型生成,输入一段录音,就可以自动生成自然的嘴型和表情。

18.jpg 新知榜记者:那您觉得影响数字人产品向消费级应用渗透的关键是什么?

NextHuman智能数字代言人白小绸:

目前的核心还是成本。为了得到更好的消费级体验,我们一般要用高性能的显卡和高精度的动捕设备,这些都阻碍了C端用户的渗透率,云渲染的成本也很贵。不过,这个成本会随着技术和用户基础的上升逐渐降低,比如基于RGB视觉算法的消费级别身体驱动,其性价比肯定要优于光学捕捉这样的身体驱动。

19.gif 

03

ChatGPT和数字人相互成就

努力实现广泛的商业化应用

新知榜记者:您如何看待ChatGPT,ChatGPT是否能在很大程度上为数字人产品赋能?

NextHuman智能数字代言人白小绸:

ChatGPT和数字人,我觉得是一种相互成就的状态。ChatGPT作为大脑,可以让数字人变得有趣有用,这是非常令人振奋的,对整个数字人行业都有促进作用;

换个角度讲,数字人也为ChatGPT提供了一种载体和界面。我们经常说,数字人是AI的UI,就非常形象,我也很认同。也许以后,很多人是通过有形的虚拟数字人来感知ChatGPT的,甚至大家不需要认知ChatGPT,只需要认识眼前的这位数字人。

QQ截图20230317135728.jpg

新知榜记者:在内容创作上,ChatGPT能虚拟形象提供哪些帮助?

NextHuman智能数字代言人白小绸:

ChatGPT核心还是为虚拟形象的个性化表达提供了可能性,本质上就是虚拟形象在大模型数据中找到一段属于自己个性化内容的区间,并且不断强化这个区间内的表达,最终就可以在粉丝面前塑造出一个性格鲜明的IP。

QQ截图20230317140312.jpg

新知榜记者:ChatGPT和AIGC技术要想实现广泛的商业化应用,关键要解决什么问题?

NextHuman智能数字代言人白小绸:

还是需要平衡通用性和垂直化,要找到明确的、精准的应用场景,建立领域模型,解决领域问题,才能够快速带来商业变现。同时也要注意,要防止因为场景过于狭窄,而陷入过早的红海竞争。其实,对于创业公司来讲,能够在界面层实现属于自己的创新,就可以打动自己的细分客户群体了。

新知榜记者:目前团队是否有尝试运用 chatGPT,效果如何?

NextHuman智能数字代言人白小绸:

ChatGPT确实极大地增加了数字人的想象空间。目前,我们平台已经接入了ChatGPT,效果还是很不错的,让数字人忽然有了灵魂,很有趣,在一些场景上也很有用。只不过,响应速度有点慢,所以在体验上还需要优化。

QQ截图20230316173917.jpg 

04

进一步降低用户创作门槛

致力于打造行业通用平台

新知榜记者:NextHuman是否计划推出一些新功能,能给用户提供什么帮助?

NextHuman智能数字代言人白小绸:

我们近期刚上线了“NPC”和“元应用”两个功能,前者为好看的皮囊增加了有趣的灵魂,结合知识库和ChatGPT,快速创作功能型数字人和数字员工;后者能够快速创作数字人互动场景,并且实现一键部署到任意终端。这些零代码的生产工具,都极大地提升了数字人的应用效率。

META-2Z966TC1-0FT8Z0UP9ZPLA4OS0H6Z1-PHU24CFL-8R3.png 另外,第一季度我们还会上线一个3D视频剪辑工具,帮助普通用户实现3D数字人的视频制作,你不需要去使用maya、3Dmax、blender、UE等专业软件,就可以直接上手3D视频制作。

新知榜记者:NextHuman最终的产品形态会是怎样的,团队的愿景是什么?

NextHuman智能数字代言人白小绸:

NextHuman希望成为行业的一个通用中台,我们会考虑融入更多的AIGC的能力,从而增强数字人产品的能力,进一步降低用户的创作门槛。同时,所有的数字人都可以通过NextHuman平台获得赋能,输出对应的能力。

21.jpg写在最后

从NextHuman产品所强调的便捷性到提供的一站式数字人创作服务,再到致力于成为行业通用平台的愿景,其实都在说明一点,NextHuman在努力一步步降低用户的数字人创作门槛,进而普惠越来越多的人,乃至给整个元宇宙产业链带来全新的想象空间。

当然,目前国内数字人产业尚处于发展的早期探索阶段,关键核心技术发展尚不成熟,这是一个挑战,更是一个机会,剩下的难题就交给时间,也交给像NextHuman这样的、正脚踏实地、努力朝前的数字人先锋企业。

本页网址:https://www.xinzhibang.net/article_detail-1610.html

寻求报道,请 点击这里 微信扫码咨询

关键词

数字人 专访 人工智能

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯

ChatGPT,Midjourney,文心一言,文心一格,bing新必应,Stable diffusion,文心一格,稿定设计,墨刀AI,mastergo,Adobe Firefly

短视频知识人物影响力榜

查看更多

新知榜独家 {{faTime.effecttime}}发布

总榜

人物 领域 粉丝数 影响力指数

{{item.manIndex}}

{{item.nickname}} {{item.field}}

{{item.fs}}

{{item.effect}}