新知榜官方账号
2023-07-10 03:46:49
10月31日,由LiveVideoStack举办的以“多媒体开启新视界”为主题的LiveVideoStackCon2020北京站如期召开。作为多媒体技术领域的盛会,大会聚焦在音频、视频、图像等技术的最新探索与应用实践,覆盖教育、娱乐、医疗、安防、交通、制造、旅游、电商、金融、社交、游戏、智能设备、IC等行业领域。
会上,腾讯多媒体实验室专家研究员肖玮进行了《腾讯天籁:“下行最后一厘米”音频体验提升》主题分享,重点介绍了腾讯天籁如何将经典信号处理技术与深度学习进行有机融合,围绕网络下行终端,提升音频体验。
年初的疫情黑天鹅事件,让数字通信手段成为了人与人沟通的重要手段,同时也对实时音视频通信的稳定性和通讯效果带来了极大考验。腾讯多媒体实验室围绕音频通信核心体验的技术和框架进行了多年的探索。在今年9月份举办的腾讯全球数字生态大会上,正式发布了“面向实时音视频应用的新一代实时音频技术品牌”——腾讯天籁。
腾讯天籁提出“下行最后一厘米”音频体验提升的概念,将经典的音频信号处理和深度学习技术结合,设计并实现了基于上下文分析的前向纠错、丢包补偿方案。信源侧单独可抗40%丢包率,整体方案可抗80%丢包率。用户在弱网环境下的通话体验可以获得极大保障。
基于领先的腾讯天籁音频解决方案,腾讯天籁不仅可以让不同地点、场景、设备终端同时远程接入,让远程线上沟通更加高效,并且还扩展了实时音频的语音带宽。与传统PSTN电话音质相比,使用了腾讯天籁技术后的音频音质更加明亮、干净。同时,整套音频算法能力也进行了有针对性的优化,可以在用户多种客户端进行部署,最终提升了音频通信的可懂度、自然度、舒适度。
肖玮现场展示了基于深度学习的语音增强方案在真实场景中的增强效果。在长达两分钟的展示环节,分别演示了地铁站、菜市场、街道等多种噪声场景。在这些场景下,腾讯天籁基于深度学习语音增强方案均能提供高质量的处理效果,现场展示获得现场观众的广泛关注。
腾讯多媒体实验室已经建立了完整的端到端通话质量评价和认证体系。借助这一体系,腾讯天籁品牌下的各种技术,在产品落地前,均要通过该体系的严格测试。此外,在技术的研发过程中,该体系的测试结果,可以给研究人员提供非常重要参考信息,用于方案的打磨和优化。
腾讯天籁不仅可以让不同地点、场景、设备终端同时远程接入,让远程线上沟通更加高效,并且还扩展了实时音频的语音带宽。其中,天籁技术是其经验和技术能力积累重要成果之一。在5G浪潮下,多媒体的技术和形式不断发生改变,高效率低延迟的传输带来了更丰富的落地场景。未来,腾讯天籁音频技术也将会加速接入腾讯旗下金融、政务、教育等行业场景下的实时音视频需求,让更多更丰富的场景落地,为用户带来极具5G时代色彩的沉浸式体验。
腾讯天籁行动也在面向公益开发者、设备厂商、NGO及行业免费开放腾讯天籁AI音频技术,帮助听障人群解决“听不清”难题,并邀请歌手周深作为公益大使,构建信息无障碍环境。
微信扫码咨询
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49