百川与智谱:开源大模型之战

新知榜官方账号

2023-07-18 22:28:41

背景

7月14日晚间,智谱AI和清华KEG突然发布公告,称为了更好地支持国产大模型开源生态,经智谱AI及清华KEG实验室决定,自即日起ChatGLM-6B和ChatGLM2-6B权重对学术研究完全开放,并且在完成企业登记获得授权后,允许免费商业使用。

百川智能作为一位后起之秀迅速崛起,成立仅仅两个月便发了开源免费可商用大模型Baichuan-7B,并且上线即巅峰,仅仅用6天时间便登上了HuggingFaceTrends的榜首,将ChatGLM-6B挤下了第一的位置。而在C-Eval、AGIEval和Gaokao等多个榜单的评测中,Baichuan-7B均获得了优异成绩,远超包括ChatGLM-6B在内的其他同规模参数的大模型。

百川智能便又推出了百亿级别参数的大模型Baichuan-13B,同样还是开源,同样还是免费可商用。在当前的生成问题与多轮评测基准中,Baichuan-13B相对于GPT-3.5、Claude基础版已经基本相当。相对于国内的百亿级开源模型,Baichuan-13B-chat具有很大的领先性(超过了20点以上)。

竞争是大模型生态的最好的催化剂

目前,行业内的共识是,百亿规模是大模型商用的最低门槛。因为如果大模型想要达到可以商用的状态,大模型在特定任务上的能力必须要有显著的提升。换言之,6B、7B参数级别的竞争只是高手过招之前的互相试探而已,真正决定谁能引领整个开源大模型争斗的胜负手还要看百亿参数级别大模型的表现。

面对加量之后的Baichuan-13B,智谱的ChatGLM2-6B属实没有了招架之力,毕竟免费的这么好用,收费的哪还会有人垂青?无奈之下,免费开源已经成了唯一的选择。天下武功唯快不破,开源大模型之战的第二局,百川并未改变免费的招式,但却用研发速度占到了便宜。

结语

这些都是货真价实,真实可以用的免费可商用基础大模型,而非为了评测而针对性优化的实验室产品,不管最后谁胜出,都是国内大模型应用生态的福音,对国内的开源生态都有很好的引领作用。从另一视角来看,大模型的发展,确实也需要你追我赶,龙争虎斗,只有「卷」起来生态才有活力。现在百川和智谱已经在开源大模型领域卷出了新高度,希望未来能有更多的公司能参与进来,共同把中国大模型这个领域做的更好。

本页网址:https://www.xinzhibang.net/article_detail-8176.html

寻求报道,请 点击这里 微信扫码咨询

关键词

百川 智谱 开源大模型

分享至微信: 微信扫码阅读

相关工具

相关文章