新知榜官方账号
2023-10-23 04:04:52
今年以来,AI(人工智能)大模型产品层出不穷。5月6日,科大讯飞发布星火认知大模型,并发布其在教育、办公、汽车、数字员工等行业的应用成果。此前,百度率先发布文心一言,阿里紧跟其后官宣通义千问,商谈科技、云知声、医联等科技公司也宣布发布或即将发布各自的AI大模型产品,清华大学、北京智源人工智能研究院、上海人工智能实验室等科研院所也发布了各自的AI大模型成果。
与数量同步增长的是争议,有不少业内人士关心:短短几个月就做出来的AI预训练大模型,真实能力究竟如何?在下一代人工智能竞争日趋激烈的当下,AI大模型领域应该“百花齐放”还是“集中力量”?算力、数据等技术型瓶颈如何突破?面对AI大模型领域的国际竞争的压力,怎么发挥中国的比较优势?
尽管此前已有不少企业探索预训练AI大模型,但这轮“百模大战”还是在OpenAI公司发布ChatGPT之后,才掀起高潮。根据民生证券相关研报的统计,目前国内至少已经有30多家大模型亮相,出品方涵盖互联网巨头、AI概念上市公司、服务器龙头企业、科研院所与一级市场创业公司,有的大模型的参数规模已经接近,甚至超越ChatGPT的规模(上千亿条)。依托这些大模型推出的类ChatGPT产品,主打的能力包括对话问答、文本及代码生成等等。
尽管有了这么多AI大模型产品,但无论是专业人士还是普通用户仍有迷思:怎么判断AI大模型的真正能力?这么多AI大模型和类GPT产品,究竟谁有真正的实力?
5月6日,科大讯飞董事长刘庆峰在接受记者采访时谈到:“对于通用大模型,中国这么多公司去做,我们需要一个相对客观的系统性的评价方法。我们要向OpenAI学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系。”
据刘庆峰透露,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。希望通过科学的评测体系推动大模型的发展。
“今天要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试。”
他认为,应该从7个维度衡量AI大模型产品是否达成通用人工智能(AGI):文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。
AI大模型研发中,算力、数据是必不可少的基础要素,也是制约大模型成果水平的关键因素。在这一轮“百模大战”中,不少企业都宣称其推出的AI大模型数据量超大、参数达千亿条,有的比肩甚至超过年初发布的ChatGPT的参数规模。
要训练一个AI大模型,是不是需要数据越多越好?对此,ChatGPT之父、OpenAI创始人萨姆·奥特曼最近在接受采访时表示,大语言模型的规模已接近极限,并非越大越好;大模型发展不应一味追求参数数量,未来大模型或以多个小模型相互协作的方式运行。
算力是另一个关键问题。近年来,随着“东数西算”、算网融合等发展,全国算力网络正在加速建设,算力正在成为AI竞争的新焦点,也成为数字经济发展的新引擎。我国算力产业规模排名全球第二,去年增长率近30%。尽管如此,但在日趋激烈的竞争中,各家企业对算力的巨大需求仍然难以满足。
依托这些大模型推出的类ChatGPT产品,主打的能力包括对话问答、文本及代码生成等等。尽管有了这么多AI大模型产品,但无论是专业人士还是普通用户仍有迷思:怎么判断AI大模型的真正能力?这么多AI大模型和类GPT产品,究竟谁有真正的实力?
科大讯飞方面也指出,“算力当然要有,但并非像大家认为的,必须要有上万块GPU才可以做。我们可以通过算法的提升来优化对算力的需求。”作为企业家,刘庆峰观察到中美之间存在算力差距,这确实会让中国在国际AI大模型研发的竞争中处于劣势。但目前国内的经验证明,中国企业可以在算力更差、模型更小的情况下,做出许多方面表现不输于ChatGPT的AI大模型产品。
对于训练AI大模型的数据,科大讯飞研究院院长刘聪认为当下能够使用的中文训练数据,无论是数量还是质量都与英文数据相比存在一定差距。
另一个让业内担忧的问题是AI大模型的污点数据。对此,刘庆峰呼吁应该提升对数据的清洗能力。
“数据本身它是有导向性的,需要把那些‘脏数据’清洗掉。(因为)有的是决定影响性能效果的,有的是影响价值导向的。”
科大讯飞方面认为,在算力提升遭遇瓶颈,训练数据数量、质量有限的情况下,算法在大模型研发中的关键作用愈加凸显。算法优势是讯飞星火大模型的核心竞争力,能够弥补目前国内大模型研究在算力和数据方面的不足。
现阶段大模型的基础理论已十分明晰,更像是一种系统性的复杂工程,“如何将其中的每一个环节‘做透’,通过算法的优化,将每一部分组合在一起发挥更大作用将是接下来发展重点。”
未来大模型的发展方向将不是一味地增加更大的算力和更大的模型,而是把各个子模型联动起来,并通过提升算法来优化其能力。
依托这些大模型推出的类ChatGPT产品,主打的能力包括对话问答、文本及代码生成等等。尽管有了这么多AI大模型产品,但无论是专业人士还是普通用户仍有迷思:怎么判断AI大模型的真正能力?这么多AI大模型和类GPT产品,究竟谁有真正的实力?
相关工具
相关文章
相关快讯
推荐
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49
国产GLM-4.5把AI价格打到地板价,实测强到离谱!
2025-07-30 09:08
用AI批量生成治愈系漫画,月入2000+
2025-07-29 09:59
千亿市场规模背后,AI短剧商业化迎来爆发期?
2025-07-17 09:19
15个作品涨粉26万!AI历史账号又出王炸案例!
2025-07-09 09:37
亲测真香!这6个AI工具让工作效率翻倍,同事追着问链接
2025-06-17 16:21