新知榜官方账号
2023-07-10 12:54:30
在发布“通义千问”不到两个月后,阿里云基于大模型在AI音视频赛道打出了一枪。6月1日,阿里云宣布通义大模型进展,聚焦音视频内容的AI新品“通义听悟”正式上线,成为国内首个开放公测的大模型应用产品。今年以来,国产AI大模型赛道热闹非凡,各家厂商、机构的大模型接踵而至,应接不暇。最新数据显示,截至目前,我国10亿级参数规模以上大模型已发布79个。
从现场演示可以看到,通义听悟接入了通义千问大模型的理解与摘要能力,能够完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。听悟还与阿里云盘打通,同时支持云盘导入和本地上传。阿里云CTO周靖人介绍,听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代工业级语音识别模型,识别准确率极高;融合自研语音语义多模态说话人算法,能对10人以上说话场景进行角色区分;接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结,支持跨多音视频内容的精准问答理解。
听悟技术负责人鄢志杰表示,通义听悟的前身是阿里云内部一个名为“听悟”的产品,主要为投资部、HR等部门做项目会议的音频转写功能,在2022年,这款产品的潜力逐步被挖掘,内部开始思考其工具属性是不是要发生变化。在接下来的阶段,听悟也将陆续推出增强版,到时候会有一些商业化的安排。
阿里云推出通义听悟之后,百度也宣布设立规模为10亿元的“百度文心投资基金”,重点投资孵化大模型领域的优质创业企业,为其提供包括资金、技术、人才在内的一站式资源。腾讯方面也在积极推进大模型的研发和应用,成立了类ChatGPT对话式产品项目组“混元助手”。各家企业、机构在大模型领域的竞争也越来越激烈。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49