首页 > 行业观察 > 机器同传:如何解决翻译难题?

机器同传:如何解决翻译难题?

新知榜官方账号

2023-07-17 17:06:58

机器同传:如何解决翻译难题?

家住上海松江区的老刘是一位从业5年的同传工作者,谈起自己的工作经历,老刘用了“水深火热”四个字。老刘说,“同传”的压力很大程度上来自“无法预料”。因为,“同传”在国际会议上用得最多,国际会议会涉及不同的领域和行业,由于不同国家背后不同的文化背景,不同的发言人也有各自的表达方式和思维习惯,即使同一种语言,却也存在不同的口音。

机器同传的出现,一定程度上减少了翻译人员的超负荷工作量。但是在人工智能领域,两种语言的“即时互译”是一项难以攻克的技术问题,主要原因在于源语言和目标语言之间存在较大的词序和语序差异。这种语序上的差异经常会使得整个语言环境与原句原意发生严重错乱,以至于常常出现尴尬的情况。现在,百度针对机器同传遇到的这些瓶颈,提出了一些解决方案。

提前预测能力

百度运用人类同传译员常用的一个技巧就是“合理预测”:在发言人话说到一半时,预测到后半句可能要讲的内容,超前翻译,这样能使同传又快又准。百度的工程师们巧妙地模仿这一点,研发出了“wait-kwords”模型,让机器同传也拥有了“合理预测”的能力,一定程度上解决了上面所说的“准确度与速度不可兼得”的问题。

不断学习专业知识

百度工程师们模仿了人类同传译员的准备过程,让机器同传也能通过快速融合领域知识策略,快速学习专业知识,提前“备课”。当AI同传接到某一个领域的翻译任务时,系统会收集该领域数据并在通用模型的基础上进行增强训练,最后对该领域术语库进行强制解码,使专业术语翻译得准确可靠,且提升翻译效率。

更准确的语音识别

百度推出了上下文无关音素组合的中英文混合建模单元,具有泛化性能好、对噪声鲁棒、中英文混合识别等特点,很好的解决了同传难题。

更强的容错能力

百度在训练数据的时候加入噪声数据,让模型在接收到错误的语音识别结果时,也能在译文中纠正过来。比如,语音识别系统将“大堂”错误地识别为“大唐”,这一对噪声词被收录到训练数据里,再把源语言句子“我们在酒店大堂见面吧”替换为“我们在酒店大唐见面吧”,而保持目标语言翻译不变“Let'smeetatthelobbyofthehotel”,同时将这两个中文句子存储在它的“大脑”里面,以后再出现类似的情况会更轻松地解决!

不知疲倦的翻译

机器最大的优势是不会因为疲倦而导致译出率下降,能把所有“听到”的句子全部翻译出来,这让机器的“译出率”可以达到100%,远高于人类译员的60%-70%。

AI同传的出现并不是取代人类译员,而是为了降低同传成本,让同传的应用范围更加广泛。希望AI技术能出现在不同的领域为我们提供便利。

本页网址:https://www.xinzhibang.net/article_detail-8089.html

寻求报道,请 点击这里 微信扫码咨询

关键词

机器同传 翻译难题 语音识别技术

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯

ChatGPT,Midjourney,文心一言,文心一格,bing新必应,Stable diffusion,文心一格,稿定设计,墨刀AI,mastergo,Adobe Firefly

短视频知识人物影响力榜

查看更多

新知榜独家 {{faTime.effecttime}}发布

总榜

人物 领域 粉丝数 影响力指数

{{item.manIndex}}

{{item.nickname}} {{item.field}}

{{item.fs}}

{{item.effect}}