搜狗在口语机器翻译领域夺魁,技术进展之快令人瞩目

新知榜官方账号

2023-07-01 15:04:46

搜狗在口语机器翻译领域夺魁

在刚刚落幕的IWSLT国际顶级口语机器翻译评测大赛上,中国公司搜狗,凭借着Baseline Model赛道的评测结果,夺得冠军。同场竞技的,还有科大讯飞、阿里巴巴、APPTEK(美国应用科技公司)、AFRL(美国空军研究实验室)以及KIT(德国卡尔斯鲁厄理工学院)等众多国内外高手。

口语机器翻译“华山论剑”IWSLT,全称:International Workshop on Spoken Language Translation,是全球最具影响力的口语机器翻译评测比赛。从2004年开始已经举办了15届。每届比赛都吸引了世界各地机器翻译领域的知名企业和研究机构参与,也是口语机器翻译领域的“华山论剑”。

本届比赛共分两大赛道:一是Baseline Model(基线模型赛道),主要评测语音翻译的流水线方案;另一赛道是End-to-End(端到端赛道),为本届尝试而新增设赛道,主要鼓励参赛方探索基于神经网络的端到端语音翻译解决方案,希望能够输入语音,基于深度神经网络模型直接输出译文。

评测考核结果都是看BLEU(机器翻译质量评价指标),值越大代表翻译质量越好。在训练集、测试集相同的情况下:Baseline Model赛道最好的系统取得了28.09的BLEU;而End-to-End赛道最好的系统仅取得了19.4的BLEU。较Baseline Model赛道相差8.69个BLEU,差距较为明显。也证明了Baseline Model赛道评测的算法仍是目前最可行和实用的解决方案。

搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6个BLEU,领先第三名的阿里巴巴5.73个BLEU。这也是搜狗WMT2017机器翻译顶级评测大赛夺冠后,拿下的又一项机器翻译领域的技术冠军。

搜狗在AI翻译领域的布局和技术进展

搜狗的AI翻译,现已众所周知。在搜狗的AI战略之中,语言是最核心的重头戏。并以“自然交互+知识计算”为AI核心方向,并持续深耕技术,推动技术向产品的快速转化。

2016年,搜狗发布了自有人机交互解决方案——知音引擎。而且因为拥有充足真实语料数据优势,搜狗将语音识别与机器翻译技术相结合,进而在2016年世界互联网大会上推出了全球首款商用AI同传系统-搜狗同传,带动了语音翻译技术的普及与应用。其后通过数百场的国际会议“实战”,搜狗同传成为当下炙手可热的“AI字幕君”。

与此同时,搜狗也开始在AI智能硬件上施展拳脚,推出了一系列的智能硬件,将语音翻译技术应用到了更广阔的场景之中,让更多消费者用户可以直观使用,并解决跨国交流的问题。2018年3月,搜狗推出了搜狗旅行翻译宝,具备离线翻译功能与拍照翻译功能,让马化腾都为之心动,在朋友圈里大打广告。其时,作为首款智能翻译硬件,搜狗旅行翻译宝支持42种语言对话翻译,解决了旅游场景中用户听不懂、看不懂、不会说等真实痛点。该项产品在京东平台首发当日即告售罄,首日销售额破千万。

现在,IWSLT比赛夺魁,不仅是搜狗AI硬实力的展示,也是中国AI实力在国际竞技场中的输出。希望搜狗依然能快速将最新技术商业化、场景化落地,让更多用户享受到AI福利。

本页网址:https://www.xinzhibang.net/article_detail-3912.html

寻求报道,请 点击这里 微信扫码咨询

关键词

搜狗 口语机器翻译 技术进展

分享至微信: 微信扫码阅读

相关工具

相关文章