搜狗实现了历史性突破,语音实时翻译质量几乎达到专业同声传译水平

新知榜官方账号

2023-07-01 17:12:43

11月17日,在乌镇举办的第三届世界互联网大会上,搜狗CEO发表题为《人工智能的未来之路》的演讲时,其中文讲话内容在实时语音识别的基础上,同步翻译为英文并上屏显示,引起了全场嘉宾的轰动。

语音识别+机器翻译迭代的背后语音识别在过去一直是科幻小说的常见场景,尽管在大多数领域,科幻作家的想象力远远超过现实。语音识别则是少有的例外,其独特性不仅仅是因为其迅速取得斐然成果,更因为其背后有更多值得挖据的领域,其中就包含令人生畏的实时翻译。

从概念上来看,语音识别是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。在这一领域,搜狗其实已经有了5年的积累,早在2011年便开始深耕语音识别的搜狗,凭借其得天独厚的条件:大量的数据资源、庞大的用户量,以及领先的算法,目前搜狗语音识别准确率已超过97%,识别速度达到了400字每分钟。

而机器翻译则是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。事实上,搜狗输入法在6.8正式版中就推出了在线翻译的功能,解决了日常输入中输入英文的问题。

在今年夏天的奇点大会上,王小川首次演示了搜狗的实时语音识别技术,将演讲内容同步识别为文字,在屏幕中显示出来,并在8月3日正式对外发布搜狗知音引擎,三个月之后世界互联网大会上,搜狗知音引擎再推新功能,在识别演讲内容的同时进行实时翻译。

在强大的计算性能和海量数据方面,搜狗有着不可多得的优势。正如业内人士所评价,“这是搜狗深度学习的寒武纪生命大爆发。”“机器同传”的突破与创举由两名到三名译员轮换进行不打断讲话者讲话的情况下的同步翻译,与会嘉宾同时佩戴同传耳机,已成了大型研讨会和国际会议的标配。在这次世界互联网大会上,也为嘉宾配备了同声传译和同传耳机,但是当王小川说到“搜索的未来就是人工智能时代的皇冠”时,屏幕上实时显示出了语音识别的中文以及“Inthefuture,searchwillbetheCrownoftheAIEra”……

据介绍,在实时性上面,中文结果实时显示,搜狗的准确率和响应速度稳居行业首位,实时反映英文的结果理想的将延迟控制在了2秒以内。在流利度方面,搜狗语音翻译采用基于语义的断句模型来断句,断句更加合理,翻译结果更加完整和流畅。在表现力上面,搜狗语音实时翻译技术同步显示听写的中文结果和翻译的英文结果,既可以通过屏幕显示展示给观众,也可以通过手机软件发送给观众。

对于实时翻译的未来,搜狗还有很多工作要做,但是搜狗语音实时翻译代表着一个重大里程碑。继续前行,搜狗会进一步优化语音实时翻译的性能和效果,带来更加惊艳的机器同传产品。

本页网址:https://www.xinzhibang.net/article_detail-3964.html

寻求报道,请 点击这里 微信扫码咨询

关键词

搜狗 语音实时翻译 神经网络

分享至微信: 微信扫码阅读

相关工具

相关文章