字节跳动AILab机器翻译技术论文荣获ACL2021最佳论文奖

新知榜官方账号

2023-07-08 17:14:29

字节跳动AILab机器翻译技术论文荣获ACL2021最佳论文奖

8月5日,国际顶级学术会议ACL2021正式颁发了大会奖项,字节跳动AILab的机器翻译技术论文当选今年度最佳论文。此前由中科院计算所主导的研究项目曾被评为ACL2019最佳长论文。官方表示,ACL2021由国际计算语言学协会举办,是自然语言处理(NLP)与计算语言学领域最高级别的学术会议。本次共有3350篇论文参与评选。

自然语言处理被看作是“人工智能皇冠上的明珠”,在机器翻译、搜索引擎、信息流、输入法等领域有着广泛的应用。词表是自然语言处理的基础组件,与词典索引类似,词表预训练模型往往需要耗费大量的时间和能源。在这次ACL2021获奖论文中,字节跳动技术团队提出了“面向机器翻译的最佳运输词表学习方案”(VocabularyLearningviaOptimalTransportforMachineTranslation,简称VOLT)。研究人员用经济学领域的“边际收益”定义了词表质量的评价指标,然后以数学领域的“最优运输方法”解决最优词表的生成问题。研究结果显示,VOLT在多种翻译任务上取得了出色的效果。同时,这种方法可以显著减少词表的学习和搜索时间,节约算力资源。

业内普遍会通过大量自然语言处理下游任务的训练以寻找最优大小,使用BPE词表的方式。而字节跳动使用的VOLT方法,能够节省92%的算力,这同时意味着所需电能的大量减少。巧合的是,这一技术的缩写VOLT同时为电学单位伏特,未来能够在工业应用上有巨大潜力,有助于节能减排。目前,VOLT研究项目已经向全球开发者开源,并将在字节跳动火山翻译业务中逐步落地,为飞书、今日头条等产品和火山引擎的企业级客户提供机器翻译支持。

本页网址:https://www.xinzhibang.net/article_detail-7057.html

寻求报道,请 点击这里 微信扫码咨询

关键词

字节跳动 机器翻译 ACL2021

分享至微信: 微信扫码阅读

相关工具

相关文章