百度发布全球首个感知上下文的机器同传模型DuTongChuan

新知榜官方账号

2023-07-08 17:46:39

背景介绍

百度机器翻译团队创新性地提出了全球首个感知上下文的机器同传模型,并基于此发布了最新的语音到语音的机器同传系统:DuTongChuan。该系统基于百度飞桨PaddlePaddle平台开发,可以实时地翻译演讲内容并以语音播报的形式传递给观众。在最新提交的论文(见传送门)结果中:汉译英准确率85.71%,英译汉准确率86.36%。并且PK3位经验丰富的人类同传译员,最终结果极具竞争力,在评估所用的BLEU和人工评价双重评价中,度同传均达到与人类专员媲美的水平。论文中还介绍,该系统已成功应用于百度2019开发者大会,将演讲内容实时地翻译给现场观众收听。现场反馈,延时大多不到3秒。与传统的字幕投屏同传相比,算得上是真正的沉浸式体验,如同人工同传一般。

机器同传模型原理

度同传机器同传模型的核心技术是全球首个上下文感知机器同传模型。该模型包括三大秘籍:语义信息单元、创新解码算法和BSTC数据集。

语义信息单元

一个人类同声传译人员,在进行翻译的时候会把听到的内容划分成一个一个语义块,对一段话进行理解翻译,既不是逐字翻译,也不是逐句翻译,这样既能保证语义不变,又能保证实时性。度同传机器同传模型学习了这个技巧,被称为语义信息单元(InformationUnit,IU)。模型会不断从自动语音识别(ASR)模型中读取实时语音流,并确定其信息单元边界,将语音流切分成一个一个翻译单元。这个切分的过程靠的是基于动态上下文的信息单元边界检测器。

创新解码算法

为了提升翻译的流畅度和一致性,百度还提出了两种创新解码算法:部分解码(PartialDecoding)和上下文感知解码(Context-awareDecoding)。部分解码用于翻译一个句子的第一个信息单元,而对于句子中其他的信息单元,则采用上下文感知解码模型进行翻译。上下文感知解码模型的特点是在训练过程中,强迫该模型学习如何在给定部分翻译内容的情况下继续翻译,在解码过程中,丢弃一部分此前生成的翻译,以便进行更流畅的翻译。

BSTC数据集

BSTC是全球首个中文-英文演讲场景语音翻译数据集,总共包含超过50小时的演讲语音和对应的转录文本、时间轴、翻译文本等数据资源。涉及IT、经济、文化、生物、艺术等多个演讲主题。该数据集现已开源,下载链接可在文末自取。

实战检验

为了验证度同传的本领,百度翻译团队邀请了3位具有3-7年工作经验的同声传译员S,A,B。研究团队模拟了一个真实的同传场景,让机器同传和同声传译员们对BSTC中的同一个演讲进行同声传译。无论是传统的BLEU自动评价指标,还是人工评价方法,机器同传都表现出了极具竞争力的翻译水平。在可接受度上,机器同传与表现最好的人类选手表现相当(73.91%VS73.04%)。而在漏译率上,机器同传则远远甩开了人类竞争对手(20%VS47%)。当然了,在漏译率明显高于机器的情况下,人类同传译员仍保持了高可接受度,说明人类在实时性要求高、脑力工作强度大的情况下,能够灵活变通,突出重要信息的传递。而机器胜在不知疲倦,漏译率低。值得注意的是,刚公开论文的度同传,实际已在2019百度AI开发者大会完成实战检验。

本页网址:https://www.xinzhibang.net/article_detail-7069.html

寻求报道,请 点击这里 微信扫码咨询

关键词

机器同传 百度 DuTongChuan

分享至微信: 微信扫码阅读

相关文章