百度研发具备预测能力和可控延迟的即时机器翻译系统

新知榜官方账号

2023-07-02 10:56:44

百度研发具备预测能力和可控延迟的即时机器翻译系统

近日，百度研发了具备预测能力和可控延迟的即时机器翻译系统，可实现两种语言之间的高质量、低延迟翻译。这是自然语言处理方面的重大技术突破，将对机器即时笔译和口译的发展起到极大地推动作用。

机器同传利用语音识别技术自动识别演讲者的讲话内容，将语音转化为文字，然后调用机器翻译引擎，将文字翻译为目标语言，显示在大屏幕或者通过语音合成播放出来。相比人类译员，机器最大的优势是不会因为疲倦而导致译出率下降，能将所有“听到”的句子全部翻译出来，这使得机器的“译出率”可以达到100%，远高于人类译员的60%-70%。同时，在价格上也占有优势。

在机器同传领域，百度联合语音技术、机器翻译技术，从语音识别、翻译质量、时延、融合领域知识等方面推出了“一揽子”解决方案。

在语音识别方面，区别于传统的上下文相关建模技术，百度提出了上下文无关音素组合的中英文混合建模单元，包含1749个上下文无关中文音节和1868个上下文无关英文音节。该方法具有泛化性能好、对噪声鲁棒、中英文混合识别等特点。

在翻译质量方面，提出了“语音容错”的对抗训练翻译模型，根据语音识别模型常犯的错误，在训练数据中有针对性的加入噪声数据，使得模型在接受到错误的语音识别结果时，也能够在译文中纠正过来。

为了降低时延提升翻译质量，人类译员通常对演讲内容进行合理预测，百度开发人员从人类译员身上获得启示，研发了“wait-kwords”模型，可以根据历史信息，直接预测翻译中目标语言词汇。该模型在翻译质量和翻译延迟之间做出了很好的平衡，用户可通过根据实际需求设定延迟时间（例如延迟1（k=1）词或延迟5(k=5)词）。

在同声传译时，经常会遇到不同领域的专业知识，这就要求同传人员在短时间内吸收大量相关领域的内容，这对他们也是极大地挑战。基于此，百度模仿人类同传的准备过程，提出了快速融合领域知识策略。该策略依托百度海量的互联网大数据，训练得到的具有通用翻译能力的模型；当它接到某一个领域的同传翻译任务时，系统会收集该领域数据并在通用模型的基础上进行增强训练，得到相应领域增的强模型；最后对该领域术语库进行强制解码，使专业术语翻译得准确可靠，且提升翻译效率。

作为对外开放和商业国际化的需求之一，同声传译被广泛应用于政府间的峰会、多边谈判和其他商业场合，但是同传人员稀缺也成为了当前的棘手问题。为了解决全球范围内同传译员人数少、费用高等难题，越来越多开发者专注于机器同传的研发，百度也希望通过研发高质量机器同传技术和系统解决即时翻译难题。虽然机器同传有了新的突破，但它与经验丰富的同传人员相比，依然存在一定差距。百度翻译技术负责人表示，同传的目的并不在于取代人类译员，而是为了降低同传成本，让同传的应用范围更加广泛，也希望世界各地的人在AI的助力下早日实现“无障碍”交流。

本页网址：https://www.xinzhibang.net/article_detail-4406.html

寻求报道，请

关键词

分享至微信：

相关工具

Bing新必应

微软推出的新版结合了ChatGPT功能的必应

天工AI助手

昆仑万维与奇点智源联合研发的对标ChatGPT的大语言模型

Replika

AI对话陪伴工具

YouChat AI

AI搜索对话工具

TigerBot

虎博科技推出的AI对话聊天机器人，基于TigerBot开源大模型

讯飞星火认知大模型

科大讯飞推出的类ChatGPT的讯飞星火认知大模型

slide美[slaɪd]滑动；幻灯片toslidedownahill从山上滑下

slide美[slaɪd]滑动；幻灯片toslidedownahill从山上滑下这是一张我放给他们看的幻灯片。在产品经理与市场的角度下，幻灯片是一种非常有效的工具，可以用于演示产品或服务的特点和优势，同时也可以用于营销和宣传。在使用幻灯片时，需要注意以下几点：幻灯片的内容要简洁明了，不宜过于复杂。幻

分类标签 slide美滑动

11-29 22:13

中后台应用开发中的低代码平台设计思路

中后台应用开发中的低代码平台设计思路中后台应用主要用于信息的查询、展示和修改，并把数据变更持久化到数据库中。产品形态可以被收敛为UI模式一致的标准化组件库，比如AntDesign、AntV等通用UI库是中后台产品前端开发的事实标准。在低代码平台中，所见即所得的组装中后台应用，代替纯手工的代码编写，可

分类标签中后台应用低代码平台DSLVue组件库

10-10 10:48

Python编程与低代码平台的结合使用

Python编程与低代码平台的结合使用在某些情况下,Python编程确实可以取代低代码自动化平台，甚至提供更强大的功能。但两者也有各自的优势，更好的方式是结合使用:Python的优势：更强大的编程能力，可以实现更复杂的逻辑和算法更高的灵活性和定制化，可以满足特定需求对数据和API的更深入的控制和管理

分类标签 Python编程低代码平台自动化系统

10-10 10:46

阿里通信与达摩院推出AI云通信解决方案

在9月22日举行的云栖大会云通信分论坛上，阿里通信与达摩院联合推出了AI云通信解决方案，致力于用智能通信能力为消费者和中小企业提供订购数字服务的首选互联网平台，赋能数字产业。据介绍，本次发布的AI云通信解决方案包括AI语音和AI短信两个基础产品，运用了达摩院TTS语音合成能力、ASR语音识别能力和N

分类标签 AI云通信达摩院阿里通信

09-14 10:34

人工智能时代：AI替代人还是人替代不会使用AI的人？

最近社交网络上人们最关心的话题之一就是：我的工作会不会被AI取代？从最初的聊天机器人，到秒出图的AI绘画应用，再到各类AI专业小模型产品的研发，大批内容生产从业者都在面临人工智能带来的“替代”挑战。ChatGPT-4发布刚过半月，金融圈就推出了第一款行业AI应用BloombergGPT。“传统权威领

分类标签人工智能AI替代就业创新

09-14 10:32

人工智能到底是统计学还是综合学科？诺贝尔经济学奖获得者与科学家们的观点不一

人工智能到底是统计学还是综合学科？近日，2011年诺贝尔经济学奖获得者托马斯·萨金特（ThomasJ.Sargent）在一场演讲中对人工智能（AI）的定义，引发了经济学家和人工智能科学家之间如何定义AI的讨论。在北京举办的世界科技创新论坛上表示，作为经济学理性预期学派的领袖人物，萨金特表示：人工智能

分类标签人工智能统计学学科算法计算力数据

09-14 10:31

阿里巴巴成为全球十大创新力企业之一

阿里巴巴成为全球十大创新力企业之一全球主要企业的“创新力”排行榜近日在日本出炉。在排名前十的企业里，阿里巴巴占据一席之地，成为唯一一家入选的中国企业。据《日本经济新闻》报道，这份榜单由市值最高的150家全球企业和168家日本本土企业的财报数据分析得出，以创新决策速度为主的“组织力”、显示技术开发能力

分类标签阿里巴巴创新力企业排名

09-14 10:28

用百度AI和微软AI对比翻译，哪个翻译的更好？

用百度AI和微软AI对比翻译，哪个翻译的更好？在现今全球化的时代，翻译已经成为了必不可少的一项技能。然而，随着机器翻译技术的不断发展，越来越多的人开始使用AI进行翻译。而在这个领域中，百度AI和微软AI是两个备受瞩目的平台。为了探讨哪个平台的翻译更加准确，我们进行了一系列的实验比较。我们先使用了百度

分类标签百度AI微软AI对比翻译

09-08 22:54

ChatGPT基础上的AI服务正在全球迅速涌现

韩国AI创业企业Upstage制作的基于KakaoTalk的聊天机器人‘AskUp’自5日问世后，4天时间使用者就突破了4万人。最近话题很高的chat机器人AIChatGPT虽然只能在OpenAI的英文网站上使用，但是AsukakaoTalk为了使用它，将其链接到了KakaoTalk上。另外，利用O

分类标签 ChatGPTAI服务OCR

08-29 22:55

人工智能会让创造性工作者变得多余吗？

美国《华尔街日报》网站1月9日发表题为《人工智能会让创造性工作者变得多余吗？》的文章，作者是克里斯托弗·里德，文章编译如下：ChatGPT让一些人质疑人工智能（AI）是否会让人类的创造力变得多余。该聊天机器人程序于去年11月由开放人工智能研究中心发布，能够比大多数人更好地针对自然语言提示快速编写出可

分类标签人工智能创造性工作者AI

08-29 22:51

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway