阿里云推出通义听悟,成为国内首个开放公测的大模型应用产品

新知榜官方账号

2023-07-10 12:54:30

阿里云推出通义听悟,成为国内首个开放公测的大模型应用产品

在发布“通义千问”不到两个月后,阿里云基于大模型在AI音视频赛道打出了一枪。6月1日,阿里云宣布通义大模型进展,聚焦音视频内容的AI新品“通义听悟”正式上线,成为国内首个开放公测的大模型应用产品。今年以来,国产AI大模型赛道热闹非凡,各家厂商、机构的大模型接踵而至,应接不暇。最新数据显示,截至目前,我国10亿级参数规模以上大模型已发布79个。

从现场演示可以看到,通义听悟接入了通义千问大模型的理解与摘要能力,能够完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。听悟还与阿里云盘打通,同时支持云盘导入和本地上传。阿里云CTO周靖人介绍,听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代工业级语音识别模型,识别准确率极高;融合自研语音语义多模态说话人算法,能对10人以上说话场景进行角色区分;接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结,支持跨多音视频内容的精准问答理解。

听悟技术负责人鄢志杰表示,通义听悟的前身是阿里云内部一个名为“听悟”的产品,主要为投资部、HR等部门做项目会议的音频转写功能,在2022年,这款产品的潜力逐步被挖掘,内部开始思考其工具属性是不是要发生变化。在接下来的阶段,听悟也将陆续推出增强版,到时候会有一些商业化的安排。

阿里云推出通义听悟之后,百度也宣布设立规模为10亿元的“百度文心投资基金”,重点投资孵化大模型领域的优质创业企业,为其提供包括资金、技术、人才在内的一站式资源。腾讯方面也在积极推进大模型的研发和应用,成立了类ChatGPT对话式产品项目组“混元助手”。各家企业、机构在大模型领域的竞争也越来越激烈。

本页网址:https://www.xinzhibang.net/article_detail-7409.html

寻求报道,请 点击这里 微信扫码咨询

关键词

阿里云 大模型 AI音视频 通义听悟 国内首个 公测

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯