中国人工智能大模型地图研究报告发布,大模型竞赛进入百模大战

新知榜官方账号

2023-09-23 00:42:49

中国人工智能大模型地图研究报告发布,大模型竞赛进入百模大战

科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,我国10亿参数规模以上的大模型已发布79个,几乎进入“百模大战”。作为全球人工智能竞赛的“主战场”,大模型的下一个“赛点”在哪里?多位业内人士提到了创新与效率。北京智源研究院院长黄铁军表示,大模型时代,通过创新来提高效率、降低成本将会是行业的长久课题。

科技公司逐鹿大模型今年3月,基于文心大模型3.0打造的百度新一代知识增强大语言模型“文心一言”公开邀测。紧接着,阿里通义千问、讯飞星火大模型、智谱AI的ChatGLM等纷纷发布。此后,美团、百川智能、云知声、美图、腾讯……新加入大模型赛道的国内科技公司此起彼伏,一场围绕大模型的“军备竞赛”已趋白热化。作为最早发布者,文心一言正在“跑步”迭代。近日,公司首席技术官王海峰向记者透露,文心大模型目前已迭代到3.5版本,在此前知识增强和检索增强的基础上,进一步提出了“知识点增强技术”,显著提升大模型对知识的掌握和运用,从而提升其在各种任务中的表现。

记者梳理发现,从已发布的情况来看,通用大模型为主,主要聚焦自然语言处理、计算机视觉、语音识别等技术领域。此外也有针对或更偏重于金融、汽车、医疗、工业等垂直领域的金融风控、自动驾驶、医疗诊断预测、工业质量控制等大模型。

推动应用落地成新课题大模型纷纷涌现,然而百行千业,各有考量,如何加速落地“最后一公里”成为新课题。作为一名教育规划领域公司创始人,林先生对于在教育规划中引入大模型的态度是“让子弹再飞一会儿”。“目前大模型层出不穷,既不知道选哪个更好,也不知道哪种更适合教育垂直领域。”林先生坦言,引入大模型的效果和成本是要考虑的关键因素。

正如林先生所顾虑的,垂直大模型的训练、精调以及形成多个大模型的组合等都成为“落地战”的关键,而经过特定训练的垂直领域中小模型,表现可能并不逊色。例如,微软以医学文章数据精调了生物领域的BioGPT-Large模型,仅有15亿参数,其在PubMedQA(生物医学研究问答数据集)基准测试中的准确率却优于有着千亿级别参数的大型通用语言模型。“这种中小规模模型,推理成本可以降低到原来的十分之一。”火山引擎的业务算法负责人吴迪表示。

为了加速推动大模型落地,提供安全计算、模型精调、评测等服务的平台也开始出现。近日,火山引擎就发布了“火山方舟”,首批集成百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等7家AI科技公司及科研院所的大模型,意在打造一个大模型“优选店”。公司总裁谭待介绍,基于“方舟”,企业可同步试用多个大模型,选用更适合自身业务需要的模型组合。

“百模大战”的下一个“赛点”在何处?百度创始人、CEO李彦宏近日在公开演讲中提出,新的国际竞争战略关键点不是一个国家有多少个大模型,而是大模型上有多少原生的AI应用,这些应用在多大程度上提升了生产效率。“如果我们能挤上牌桌,获得竞赛入场券,中国将拥有更壮大的数字化产业,数字经济规模将获得巨大增长。”

多位投资人也提醒,应审慎看待热到发烫的大模型竞赛。九合创投创始人王啸说,不能太“神化”AI大模型,大模型不能解决所有需求,有些场景用大模型解决的是伪问题,对待大模型创业项目需要拉长周期来看。

来源:北京日报记者孙奇茹赵语涵

版权声明:文本版权归京报集团所有,未经许可,不得转载或改编。

本页网址:https://www.xinzhibang.net/article_detail-13170.html

寻求报道,请 点击这里 微信扫码咨询

关键词

人工智能 大模型 竞赛

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯