AI配音技术是否能代替人工字幕？了解声音克隆、合成声音及其欺诈应用

新知榜官方账号

2023-07-04 01:41:05

今年，《鱿鱼游戏》大火。随着Netflix等流媒体的兴起，非英语作品也越来越多。然而，字幕和配音行业的人才却非常紧缺，尤其是小语种直译方面。为此，不管是Netflix，还是小型的本地化供应商，都在探索能不能用AI配音技术代替人工字幕。

一个时代，终究还是落幕了。11月22日，上海第三中院对「人人影视字幕组」侵权案进行公开审理，并当庭作出一审判决。以侵犯著作权罪判处被告人梁永平有期徒刑三年六个月，并处罚金人民币一百五十万元。违法所得予以追缴，扣押在案的供犯罪所用的本人财物等予以没收。

随着Netflix等流媒体的兴起，像是《鱿鱼游戏》这类的非英语作品也越来越多。然而，字幕和配音行业的人才却非常紧缺，尤其是小语种直译方面。还是以《鱿鱼游戏》为例，如果想将其推向西班牙语市场，通常会先输出英文版的字幕，然而再在这个基础上进行法语翻译。也就是说，部分语种字幕的质量完全取决于英文的翻译如何，而这个转化过程难免会丢失很多信息细节。据统计，《鱿鱼游戏》的配音版比字幕版的观看人数还要多。为此，不管是Netflix这样的流媒体巨头，还是一些小型的本地化服务供应商，都在探索能不能用AI技术代替人工翻译。

那么，AI到底是能行，还是不能行？这就得从DeepfakeVoice是什么开始说起了。DeepfakeVoice复制或克隆一个人的声音，常用到的一项技术叫DeepfakeVoice，也称为语音克隆或合成语音，其目的是使用AI生成一个人的语音。目前，这项技术已经发展到可以在音调和相似度上非常精确地复制人声的地步。

声音克隆是一个过程，在这个过程中，人们使用计算机生成真实个体的语音，使用人工智能（AI）创建一个特定的、独特的声音的克隆。要克隆某人的声音，必须有训练数据输给人工智能模型。这些数据通常记录了目标人说话的例子。人工智能可以使用这些数据来呈现一个真实的声音，比如可以用文字键入的任何东西生成一段语音，这个过程称为文本到语音。在以往的文本到语音（TTS）系统中，训练数据是关键组成部分，它控制了语音输出的产生。换句话说，你听到的声音就应该是数据集中给出的声音。不过现在，随着最新AI技术的引入，使用一些目标声音的特征，比如语音波形，也可以进行更深入的分析和提取。

合成声音是一个术语，也就是通常所说的DeepfakeVoice，合成声音也经常与声音克隆互换使用。但简单来说，合成语音就是计算机生成的语音，也叫语音合成，一般是通过人工智能（AI）和深度学习来实现的。合成声音的方式主要有两种：文本到语音转换（TTS）和语音到语音（STS）。文本到语音转换（TTS）在上文中已经介绍过，目前，TTS软件已被用于帮助视障人士阅读数字文本，还被搭载在语音助手等其他应用上。而语音到语音（STS）不是使用文本，而是使用一段语音修改其声音的特征来创建另一段听起来很真实的合成语音。过去的语音合成并不能生成以假乱真的声音。但是随着技术的发展，这种情况已经改变。

传统的语音合成通常使用两种基本技术。这两种技术是拼接合成和共振峰合成。拼接合成采用的方法是将录制声音的短样本拼接在一起，形成一个称为单元的链。这些单元然后被用来生成用户定义的声音模式。而共振峰合成这种技术最常用来复制人们用元音发出的声音。这些方法的缺点是，它们时不时会生成一些人们无法发出的声音。但是深度学习和人工智能的出现将TTS技术带到了新的高度。AI文本到语音转换通常被称为神经文本到语音转换，它利用神经网络和机器学习技术从文本中合成语音输出。

中文版DeepfakeVoice尝鲜吗？今年10月，GitHub上的一个项目狂揽13k星。只需5秒，就能用AI技术来模拟声音来生成任意语音内容，并且还支持中文。根据上传的演示视频来看，声音模仿的也很逼真。MockingBird的主要特性包括：支持普通话并使用多种中文数据集进行测试；适用于pytorch，已在1.9.0版本中测试，GPUTeslaT4和GTX2060可在Windows操作系统和Linux操作系统中运行（苹果系统M1版也有社区成功运行案例）；仅需下载或新训练合成器（synthesizer就有良好效果，复用预训练的编码器/声码器，或实时的HiFi-GAN作为vocoder）；提供一个Webserver可查看训练结果，供远程调用。

DeepfakeVoice带来的语音欺诈是一个很大的问题。2019年，犯罪分子克隆了一家总部位于英国的能源公司CEO的声音，骗走了24万美元，原因就是这个假CEO在口音和语气上听起来都是十分真实的。这起事件是欧洲已知的第一起直接使用人工智能的网络犯罪。另一起事件发生在2020年。一位在阿拉伯联合酋长国工作的银行经理接了一个电话，他当时以为他在和一家公司的董事说话，结果掉进了一个彻头彻尾的语音骗局，错误地批准了3500万美元的转账。随着技术的发展，DeepfakeVoice诈骗变得越来越复杂，许多人可能在社交媒体上就已经遇到过一些DeepfakeVoice伪造的声音。

有两种方法来防范DeepfakeVoice欺诈。第一种方法是创建一个检测器，分析声音以确定它是否是使用deepfake技术制作的。不幸的是，因为DeepfakeVoice技术会不断发展，检测器无法永远保持正确。第二种方法则相对更加现实，主要是实现一个听众听不到、人们也无法编辑的音频水印。音频水印本质上是声音被创造、编辑和使用的记录。这样一来，人们就更容易知道一段声音是否是合成的。

本页网址：https://www.xinzhibang.net/article_detail-5135.html

寻求报道，请

关键词

AI配音技术人工字幕声音克隆合成声音 DeepfakeVoice 语音诈骗

分享至微信：

相关工具

Krisp

AI噪音消除工具

IBM Watson文字转语音

IBM Watson文字转语音

讯飞智作

科大讯飞推出的AI转语音和配音工具

BGM猫

灵动音科技推出的AI智能生成BGM音乐

Riffusion

AI生成不同风格的音乐

Speechify

超2000万人都在用的文字转语音朗读器

中国式浪漫

中国式浪漫中国式的浪漫有着独特的韵味，充满了婉约而华贵的情感。从古至今，我们常常可以看到一些文艺作品中描绘的恋人们穿越古代的长廊，相互倾诉着深情而含蓄的爱意。这种浪漫，不单单是一种场景的表达，更多的是一种文化的传承。在现代社会中，这种东方之美依然在中国式的爱情中得以体现。例如，现代新人在婚礼上常常选

分类标签中国式浪漫传统文化现代社会

12-07 22:22

如何学习插画？插画师必备的素材灵感网站大全

如何学习插画？插画师必备的素材灵感网站大全想要学习插画，你需要了解一些学习技巧，以及在哪里寻找学习绘画的素材。本文为你收集整理了一些关于如何学习插画的教程，以及插画师必备的素材灵感网站。插画师必备的素材灵感网站：ArtStation：主要以游戏或者影视的概念艺术设定及3D模型为主，这里基本上都是极高

分类标签插画学习技巧绘画资源

12-05 02:08

字节跳动海绵乐队：进军AI音乐创作领域

字节跳动海绵乐队：进军AI音乐创作领域近年来，随着人工智能技术的不断发展，AI音乐创作已经成为了音乐领域的热门话题。2021年初，字节跳动推出了一款名为“海绵乐队”的APP，该应用引入了大量AI技术来协助音频创作和编辑。与传统的音乐录制和编辑工具不同，“海绵乐队”具有录音棚、弹唱优化、一键remix

分类标签字节跳动海绵乐队AI音乐创作人工智能

12-01 22:29

配音网站上的真人配音怎么做，最全攻略免费送

配音网站上的真人配音怎么做，最全攻略免费送配音网站的功能有两种，一种是为专业配音人员搭建商务平台，在行业中发挥自己的专业优势。一种是为用户提供专业的配音服务，其中包括智能配音和真人配音两种情况。所以配音网站的存在也可以看作是为用户和配音人员搭建起来的沟通桥梁，在各取所需的基础上为大家带来高质量的合作

分类标签配音网站真人配音智能配音

11-25 16:20

八款AI智能软件，提高工作效率，解决各种日常问题

聊天机器人——ChatGPTChatGPT是一款功能强大的聊天机器人，它能够像人类一样聊天交流，还可以写邮件、写论文、写视频脚本，翻译、敲代码等，帮助我们提高工作效率，解决各种日常问题。写作助手——NotionAiNotionAi是一款强大的写作助手，它能根据输入的关键词，推荐相关的文章素材，可以帮

分类标签 AI智能软件提高工作效率解决日常问题

11-23 22:11

如何快速制作小和尚开口说话视频并实现快速变现

近来，小和尚开口说话视频风靡一时，不少人通过这种方式实现了快速变现。本文将为您介绍制作这种视频的方法。小和尚图片制作使用AI辅助工具midjourney，通过输入小和尚的描述词并将其翻译成英文，即可自动生成高清的小和尚图片。从系统提供的多张选项中选择最满意的图片，并下载保存。文案与音频制作从同行的热

分类标签小和尚开口说话视频快速变现

11-19 16:18

阿才与狐仙的爱情故事

阿才与狐仙的爱情故事阿才与狐仙的爱情故事，是一个流传千古的美丽传说。在古老的村庄里，阿才与狐仙相遇，经历了许多艰难险阻，最终战胜了邪恶的道士，过上了幸福美满的生活。阿才是一个年轻人，长相英俊，但因为家境贫困，一直未能娶到心仪的姑娘。然而，他并没有因此灰心丧气，依然努力生活，相信自己终有一天会遇到自己

分类标签阿才狐仙爱情故事

11-19 16:17

协助老年人从仰卧位转换为床边坐起

协助老年人从仰卧位转换为床边坐起随着人口老龄化的加剧，老年人的护理成为了一个重要的问题。协助老年人从仰卧位转换为床边坐起是老年人护理中的一个重要环节，需要护理员具备一定的专业知识和技能。下面，我们来介绍一下具体的步骤和注意事项。步骤老年人自愿且身体状况允许。护理员穿戴整齐，洗手并表现得温和。全面评估

分类标签老年人仰卧位床边坐起

11-19 16:15

数字人、TTS、VR等技术助力苏州广电传媒集团在苏州文化创意设计产业交易博览会中获得成功

数字人、TTS、VR等技术助力苏州广电传媒集团在苏州文化创意设计产业交易博览会中获得成功近日，在第十二届中国苏州文化创意设计产业交易博览会（以下简称“苏州文博会”）中，苏州广电传媒集团（总台）（以下简称苏州广电）以“数字赋能广电+文化”为主题参展，用数字人、TTS、VR等技术为现场观众带来了沉浸式的

分类标签数字人TTSVR

11-19 16:14

民间故事：麻雀报恩

民间故事：麻雀报恩从前有兄弟二人，老大性格霸道，老二温和善良。父母去世后，兄弟俩分家产，老大独占了良田和房屋，而老二只得到了一间小房子和一小块薄田。一天，老二在家中听到麻雀的叫声，开门一看，发现一只幼鸟从屋檐上的窝里掉了下来，摔断了腿。他很可怜这只小鸟，便捡起来找了一段布条，小心翼翼地把它的腿缠起来

分类标签民间故事麻雀报恩善良

11-19 16:13