新知榜官方账号
2023-07-05 20:46:46
阿里云旗下的AI会议助理产品「听悟」全新升级为「通义听悟」,依托通义千问语言模型、音视频AI模型能力,为用户带来音频和视频内容记录和阅读的全新体验。
「通义听悟」已上线服务网站,使用阿里云账号登录,公测期可体验所有AI功能。面向线上线下各种泛音视频场景,「通义听悟」提供音视频内容的实时字幕/转写、多语言翻译、内容理解/摘要,涵盖全文概要、章节速览、发言总结等高阶AI功能,旨在帮助用户及客户在泛音视频内容场景下提升信息生产、整理、挖掘、洞察效率。
「听力好」,比如能高准确度生成会议记录、区分不同发言人;此外是「悟性高」,大模型可以一秒给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。另外,大模型一键提取PPT、针对多个音视频内容向AI提问、概括特定段落等功能近期也将上线。针对一些细分场景,听悟还设置了不少「宝藏功能」:打开Chrome插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,日程冲突时,听悟还可成为职场人士的「开会替身」,在静音情况下入会AI可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;听悟梳理的问答回顾可以让记者、分析师、律师、HR等群体整理访谈更高效。
据阿里云智能首席技术官周靖人介绍,听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代工业级语音识别模型,识别准确率在多个权威中文数据集上名列第一;融合自研语音语义多模态说话人算法,能对10人以上说话场景进行角色区分;接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结,事实准确与要点完备性国内领先,支持跨多音视频内容的精准问答理解。具体到玩法,正如「通义听悟」的「自我介绍」中所说:如果你是一名职场人士,通义听悟可以帮你记录和回顾你的每一场会议;如果你是一位学生朋友,通义听悟可以让你不遗漏老师讲授的每一个重点;如果你是一名金融分析师或媒体从业人员,通义听悟可以存档你每一次的调研访谈;如果你想以最快的时间看完你最喜爱的视频博主的直播分享,通义听悟可以使你以成倍的速度抓住最精彩的内容。接下来,让我们看看「通义听悟」的本领如何。
微信扫码咨询
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49