搜狗同传3.0,首个具备多模态认知能力的同传系统

新知榜官方账号

2023-07-01 16:34:25

搜狗同传3.0是首个具备多模态认知能力的同传系统,基于搜狗独创的“语境引擎”,以“多模态”和“自主学习“为核心,加入视觉和思维能力,实现了边听边看边思考,引领AI同传进入了多模态认知时代。

AI同传一直是人工智能技术的重点领域。搜狗同传技术再升级,解锁两项“超能力”。2016年,搜狗发布行业第一个商用AI同传产品——搜狗同传1.0,在打造了这一全新品类的同时,用AI技术助力同声传译行业,有效推动了跨语言的交流和表达。2018年发布的搜狗同传2.0,为用户提供了更丰富的个性化定制能力。两代搜狗同传的核心能力都在于“听”,但通过数千场机器同传的实际应用,搜狗发现,业内主流的语音同传系统无法满足多样化的演讲场合需求,存在识别和翻译效果不佳的情况。

为了解决上述问题,搜狗在AI同传领域首创“语境引擎”,使得搜狗同传在“能听”的基础上,又解锁了“会看”和“能理解会推理”两项新技能,不仅能够通过“观看”自主学习演讲者的报告内容,更能够通过“理解”和“思考”,做出高质量的识别和翻译,引领了行业的技术进步。

搜狗同传3.0为演讲者构建了个性化的认知语境,能够跟随演讲者一起“思考”,无疑是AI同传领域的又一大技术创新。未来,这一系统将会在大会演讲、视频翻译、实时直播字幕等场景得到应用,为人们带来准确流畅的同声传译服务。

数据显示,在“听”“看”“思考”三位一体的作用下,搜狗多模态同传系统针对PPT内容的识别准确率提升21.7%,翻译正确率提升40.3%。搜狗同传3.0引领AI同传进入新时代,继续为行业发展做出贡献。

本页网址:https://www.xinzhibang.net/article_detail-3948.html

寻求报道,请 点击这里 微信扫码咨询

关键词

搜狗同传3.0 多模态认知 AI同传

分享至微信: 微信扫码阅读

相关文章