新知榜官方账号
2023-07-08 08:54:49
随着计算机图形学的发展,3D生成技术正逐渐成为研究热点。然而,从文本或图像生成3D模型仍然存在许多挑战。近期,Google、NVIDIA和微软等公司推出了基于神经辐射场(NeRF)的3D生成方法,但这些方法与传统的3D渲染软件(如Unity、UnrealEngine和Maya等)存在兼容性问题,限制了其在实际应用中的广泛应用。为此,影眸科技与上海科技大学的研发团队提出了一种文本指导的渐进式3D生成框架,旨在解决这些问题。
根据文字描述生成3D资产该研究团队提出的文本指导的渐进式3D生成框架(简称DreamFace),结合了视觉-语言模型、隐式扩散模型和基于物理的材质扩散技术,生成符合计算机图形制作标准的3D资产。这一框架的创新之处在于其几何体生成、基于物理的材质扩散生成和动画能力生成三个模块。这项工作已被顶级期刊TransactionsonGraphics接收,并将在国际计算机图形学顶级会议SIGGRAPH2023上展示。
如何实现DreamFace三大功能
DreamFace主要包括三个模块,几何体生成,基于物理的材质扩散和动画能力生成。相比先前的3D生成工作,该工作的主要贡献包括:提出了DreamFace这一新颖的生成方案,将最近的视觉-语言模型与可动画和物理材质的面部资产相结合,通过渐进式学习来分离几何、外观和动画能力。引入了双通道外观生成的设计,将一种新颖的材质扩散模型与预训练模型相结合,同时在潜在空间和图像空间进行两阶段优化。使用BlendShapes或生成的PersonalizedBlendShapes的面部资产具备动画能力,并进一步展示了DreamFace在自然人物设计方面的应用。
5分钟生成指定3D资产
DreamFace框架在名人生成、描述生成角色等任务上取得了良好的效果,并在用户评估中获得了超过先前工作的成绩。同时,与现有方法相比,运行时间上具有明显优势。此外,DreamFace支持使用提示和草图进行纹理编辑,实现全局编辑效果(如老化、化妆)和局部编辑效果(如纹身、胡须、胎记)。可用于影视、游戏等行业作为一种文本指导的渐进式3D生成框架,DreamFace结合了视觉-语言模型、隐式扩散模型和基于物理的材质扩散技术,实现了高精度、高效率和良好兼容性的3D生成。该框架为解决复杂的3D生成任务提供了有效解决方案,有望推动更多类似的研究和技术发展。此外,基于物理的材质扩散生成和动画能力生成将推动3D生成技术在影视制作、游戏开发和其他相关行业的应用。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49