新知榜官方账号
2023-07-11 17:16:50
不久之前,同传AI刚刚在国内掀起暴风雨,以至于让大众认为现阶段的AI技术尚未达到企业宣传的程度。不过,近日,百度于硅谷宣布了最新重大突破,即一个名为STACL的同传AI,其论文结果优异,Demo的效果也很惊人。并且,MIT科技评论、IEEESpectrum等一众外媒,还纷纷给出好评。
攻克AI同传翻译难题众所周知,在AI领域,两种语言的“即时互译”是一项难以攻克的技术问题,之所以如此,是在于源语言和目标语言之间存在较大的词序和语序的差异。百度STACL同传AI则解决了这一难题。据百度方面介绍,STACL具备了预测能力和可控延迟的即时机器翻译系统,其可实现两种语言之间的高质量、低延时翻译。
那STACL翻译能达到什么程度?IEEESpectrum在采访之后给出了类比:跟联合国会议里的人类同传相媲美。如果真是如此,那百度AI同传相比其他同类产品的突破确实是蛮大的。
为了能够让STACL拥有预测和即时翻译能力,百度开发人员从人类译员身上获得启示,从而研发了“wait-kwords”模型,该模型可以根据历史信息,直接预测翻译中目标语言词汇。此外,该模型在翻译质量和翻译延迟之间做出了很好的平衡,用户可根据实际需求设定延迟时间(例如延迟1(k=1)词或延迟5(k=5)词)。比如,法语和西班牙语这种较为接近的语言,延迟可设置在比较低的水平;但是,对于英语和汉语这种差异较大的语言,以及英语和德语这种词序不同的语言,延迟应当设置为较高水平,以便于更好的应对差异。
在同传领域,百度除了推出同传AI产品外,还联合语音技术、机器翻译技术,从语音识别、翻译质量、时延、融合领域知识等方面推出了“一揽子”解决方案。相比人类译员,机器最大的优势就是不会因为疲倦而导致译出率下降,这也使得机器的译出率可达到100%,远高于人类译员的60%-70%,同时,在价格上也占有优势。
然而,在翻译正确率上,现阶段的机器同传却有点一言难尽。为此,百度联合在语音识别方面,区别于传统的上下文相关的建模技术,提出了上下文无关音素组合的中英文混合建模单元,包含1749个上下文无关中文音节和1868个上下文无关英文音节。在翻译质量方面,百度还提出了“语音容错”的对抗训练翻译模型,该模型可根据语音识别模型常犯的错误,在训练数据中有针对性的加入噪声数据,从而使得模型在接收到错误的语音识别结果时,也能够在译文中纠正过来。
最后,我们都知道,在同声传译时,经常会遇到不同领域的专业知识,这就要求同传人员在短时间内吸收大量相关领域的内容,这对他们而言,也是极大地挑战。基于此,百度模仿人类同传的准备过程,提出了快速融合领域知识策略。该策略依托百度海量的互联网大数据,训练得到具有通用翻译能力的模型。
据悉,此次百度在AI同传上的重大突破首先在外媒发布。外媒中,给出最好评价的媒体是IEEESpectrum,认为百度开发的这个新系统,可以与联合国会议期间提供同传服务的口译人员相媲美。不过,该技术到底好与不好,究竟是重大突破,亦或是只是完美Demo,到时候我们一看便知。因为,最快百度将于下周的年度技术大会上,对该技术进行公开展示。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49