新知榜官方账号
2023-09-16 22:58:28
当下,基于生成式的人工智能技术(AIGC),仍然需要海量数据进行训练才能得到一个回复质量较高的模型算法,初期训练成本非常之高。这对于倾向自研基础大模型的企业是必须要过的门槛。
现在,阿里云通义听悟成为国内首个开放公测的大模型应用产品,聚焦音视频AI,具备“听力好”,能高准确度生成会议记录、区分不同发言人,“悟性高”,可形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。
从市场需求的共性来看,企业对AI技术更关心,关心怎么跟业务融合,但同时也会有些担忧或紧张,新技术会不会对业务带来冲击。与此同时,各国对人工智能和数据获取监管的法律条文,以及对“类ChatGPT”的支持力度,也在反映这种观望态度。
对于人工智能大模型技术,存在着训练成本高、算法不稳定等技术挑战。但在阿里云CTO周靖人看来,有了通义大模型的加持,阿里将多年积累的语音技术,以及多模态的能力有机结合起来,最终形成今天的通义听悟。
通义听悟的定位为一款工作学习AI助手,瞄准具有高知识附加值的音视频内容场景,如开会、上课、访谈、培训、面试、直播、看视频、听播客等,能通过大模型等最新AI技术快速提炼和沉淀知识。通义听悟能够高准确度生成会议记录、区分不同发言人,形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。
市面上成熟的AI音视频产品并不在少数,除了讯飞、搜狗、网易有道等具备软硬件能力的服务商外,飞书妙记、腾讯会议等互联网公司孵化的企业办公生产力工具,也同样具备相似的能力。但是,通义听悟通过大模型技术的突破,能够高准确度生成会议记录、区分不同发言人,形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项,具有一定的市场竞争优势。
随着人工智能技术不断发展,大模型技术将成为未来的发展趋势。同时,大模型技术也存在着训练成本高、算法不稳定等技术挑战。但是,通过大模型技术的突破,通义听悟已经实现了高准确度的语音识别和摘要能力。未来,通义听悟将会被各种各样的业务系统集成,集成到智能化服务中,开发者可根据实际场景,最终打造基于业务场景的MaaS服务。通义听悟的未来前景令人期待。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49