数字人如何开口说话？从场景变化到无场景变化，教你一步步实现

新知榜官方账号

2023-11-20 08:38:19

数字人如何开口说话？从场景变化到无场景变化，教你一步步实现

在上一期文章中，我们介绍了如何用AI技术创建属于自己的数字人。一是数字人形象定位，二是创作目标形象的提示词（prompt），三是利用“文字生成图片”功能生成目标形象，四是让创建好的数字人开口说话。因为篇幅关系，上期只介绍了前三步，本期咱们接着聊一聊第四个步骤，如何让图片上的数字人开口说话。

要让数字人开口说话，我们首先还是要选择好工具，以便让数字人在有场景变化和无场景变化的情况下都能按要求开口说话。首先，需要选择适合的AI工具；StableDiffusion是一个强大的深度学习模型，可以运用于图像生成和文本到图像的转换环节。剪映则是一个易于使用的视频编辑工具，可以用于视频、音频的编辑和特效处理等。这些工具都可以为数字人开口说话提供支持。

为了让数字人能够开口说话，需要准备相应的文本内容和语音素材。文本内容可以来自于剧本、故事、寓言、人生哲理等，语音素材则可以来自于录音或语音合成。在准备这些内容时，需要注意内容的质量和多样性，以确保数字人能够很好地理解，并生成预期视频。

在有场景变化的情况下，可以利用StableDiffusion将文本转换为图像。具体来说，可以将数字人的对话文本作为输入，通过StableDiffusion生成与对话内容相关的图像。这需要训练一个合适的模型，并使用大量的文本和图像数据进行训练，以获得最佳的生成效果。

如果相较于有场景变化要求，在无场景变化要求的情况下，让数字人动起来要简单的多。可以直接使用AI软件D-ID和Heygen来实现，但这两个软件都是国外的，目前国内使用起来还不太方便，并不适合普通人使用。剪映是一款目前在国内口碑较好的音视频编辑软件，可将数字人的语音与视频素材进行合成编辑。具体来说，可以将数字人的对话文本转换为语音信号，并将其与视频素材进行合成，如音频混合、音效添加、字幕添加等，以实现最佳的输出效果。

如果上述的StableDiffusion、D-ID和Heygen你都无法掌握其中的任何一个，别气馁，我还有其他的办法让你的辛勤劳动不至于已经到了这一步还卡壳。“闪剪”，一款简单实用的视频编辑软件，简单易学易上手，虽然它的表现效果暂时还没有StableDiffusion丰富，但就无场景变化的视频直播来说，他已经能够满足基本需求，让你的数字人实现从静态到动态，从无声到有声的飞跃。

好了，文章写到这里，我们已经有了符合我们预期的会开口说话的数字人了，那么下一期我将介绍如何通过捕捉社会热点来制作直播文案，以达到激发观众的情绪共鸣，从而获得更多流量支持。

往期文章

逆袭利器：普通人如何利用AI技术跻身富裕阶层？（一）
逆袭利器：普通人如何利用AI技术跻身富裕阶层？（二）
逆袭利器：普通人如何利用AI技术跻身富裕阶层（三）
逆袭利器：普通人如何利用AI技术跻身富裕阶层（四）
逆袭利器：普通人如何利用AI技术跻身富裕阶层（五）
逆袭利器：普通人如何利用AI技术跻身富裕阶层（六）

本页网址：https://www.xinzhibang.net/article_detail-20558.html

寻求报道，请

关键词

数字人 AI技术视频编辑语音合成 StableDiffusion 剪映

分享至微信：

相关工具

D-ID

AI真人口播视频生成工具

Synthesia

AI视频生成平台

SteveAI

Animaker旗下AI在线视频制作工具

Wonder Studio

AI自动为CG角色制作动画、打光并将其合成到真人场景中

Synthesys

AI虚拟人出镜讲解

Neurodub

端到端的AI视频语音本地化工具

利用AI工具帮助制作短视频的方法

现在各短视频渠道的用户数量众多，已经成为流量聚集地，想要制作视频对新手来说确实会有一些些复杂，对大多数用户来说运用AI制作短视频是一个不错的选择！确定视频的主题：其实主要就是你想要在视频中传达什么信息。编写视频脚本：根据上一步的主题内容编写视频脚本。筹备拍摄：确定视频拍摄的时间、地点、人物、道具等。

分类标签短视频AI工具视频制作

12-07 02:07

D-ID：人脸去识别化技术服务

D-ID：人脸去识别化技术服务D-ID全称de-identification，主要是人脸去识别化技术服务。简单点讲，短视频中，可以创造一个虚拟化讲解员，在视频中代替真人出镜，介绍视频内容。这是一家以色列的创新公司，创始人兼CEO是GilPerry，这种技术探索和应用仍处于早期阶段，其核心亮点是对隐私

分类标签 D-ID人脸去识别化虚拟化讲解员

12-04 08:35

分享8款AI智能软件，提高工作效率解决日常问题

分享8款AI智能软件，提高工作效率解决日常问题阿志是一位自媒体人，分享了他在用的8款AI智能软件。第一款是ChatGPT，它是一款聊天机器人，可以像人类一样聊天交流，还可以写邮件、写论文、写视频脚本，翻译、敲代码等，可以帮助我们提高工作效率，解决各种日常问题。第二款是NotionAi，它是一款强大的

分类标签 AI智能软件自媒体工作效率

11-28 08:50

如何使用DupDub免费制作专业的数字人视频

背景介绍以D-ID、HeyGen为代表的数字人视频制作网站，虽然可以帮助内容创作者制作完美的形象和专业的配音，不过此类网站的免费额度有限，输出的视频还会带有水印！今天馆长为大家介绍一个全能的在线视频剪辑平台DupDub！可以作为D-ID的替代，帮你免费制作专业的数字人视频。DupDub的功能介绍作为

分类标签 DupDub数字人视频制作免费

11-22 02:22

如何生成一个根据自己形象特别制作的数字人？

如何生成一个根据自己形象特别制作的数字人？近日，记者直击“打工替身”生成现场，借助百度智能云曦灵，原来“自己造自己”只需要以下三步：上传自己的照片或者视频，选择性别和年龄段。根据自己的面部特征，选择相应的脸部轮廓和五官，进行微调。生成数字人，可用于个性化表情包、虚拟形象等多种场景。相比传统的制作方法

分类标签数字人百度智能云曦灵

11-20 08:46

AI佛祖带着ChatGPT的智慧普渡众生

背景这届年轻人和玄学走得很近。当虔诚的佛教信徒还在念经吃斋打坐，互联网潮人们已经开始敲电子木鱼积累功德了。电子木鱼用户量早已超过500万大关，而在前不久，日本一个名为HOTOKEAI的网站迅速走红，原因也是因为是运用了ChatGPT创造出AI佛祖，搞了一出赛博玄学。进到HOTOKEAI网站后，用户可

分类标签 AI佛祖ChatGPTHOTOKEAI

11-20 08:45

首届全球数字贸易博览会在杭州开幕

首届全球数字贸易博览会在杭州开幕12月11日，首届全球数字贸易博览会（以下简称“数贸会”）在杭州开幕。数贸会吸引了来自全球的数字贸易企业和专业人士参加。其中，位于3C07展位的四川数字贸易主题馆，创新引入三星堆文化元素，巧妙融入了大熊猫、自贡彩灯等四川元素，呈现“古蜀先人以‘纵目’探求世界，今日川人

分类标签数字贸易博览会四川主题馆数字经济跨境电商人工智能全息数字人

11-16 10:02

数字人在新时代的应用

数字人在体育赛事中的应用首届全国学生（青年）运动会将于11月在广西举办。广西旅游发展集团推出了“刘三姐数字人”全新运动形象，以协助推广首届学青会。本届学青会，“刘三姐数字人”将以全新运动形象亮相，带领观众突破次元壁，解锁虚实结合的全新观赛体验，展现出壮美广西的文体魅力与前沿科技力量。数字人在电商平台

分类标签数字人虚拟形象元宇宙

11-16 10:01

虚拟人产业走向：资本热捧、技术挑战、未来展望

虚拟人产业走向：资本热捧、技术挑战、未来展望虚拟人产业已经成为资本下注的新目标。公开数据显示，截至今年9月，国内虚拟数字人赛道投融资金额已超过去年，达到24.9亿元。2021年虚拟数字人相关企业投融资金额约为19.71亿元，而在2015年这一统计数字仅为0.33亿元，6年间复合增长率达到97.71

分类标签虚拟人产业资本技术未来展望

11-16 10:00

使用飞桨深度学习框架生成2D数字人的实现步骤

使用飞桨深度学习框架生成2D数字人的实现步骤本篇学习记录的时间为：2023年8月17号。本篇不涉及什么具体深度学习的内容，就纯粹的使用。基于百度开源的飞桨深度学习框架，弄了一个2D数字人。虽效果不怎么好，但也算实现了吧。效果如下：详细实现步骤如下：步骤1:环境搭建我的电脑没有nvidia的gpu，虽

分类标签飞桨深度学习2D数字人

11-16 08:55