新知榜官方账号
2023-11-13 16:45:15
阿里云于9月25日开源了Qwen-14B及其对话模型Qwen-14B-Chat,用户可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用。Qwen-14B相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力,最大支持8k的上下文窗口长度。
Qwen-14B-Chat是在基座模型上经过精细的监督式微调得到的对话模型。借助基座模型强大性能,Qwen-14B-Chat生成内容的准确度大幅提升,也更符合人类偏好,内容创作上的想象力和丰富度也有显著扩展。同时,Qwen-14B进一步提高了小尺寸模型的性能上限,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评中取得优秀成绩,超越所有测评中的SOTA(State-Of-The-Art)大模型,也全面超越Llama-2-13B,比起Llama2的34B、70B模型也并不逊色。
Qwen-14B和Qwen-7B处于不同量级,相比此前开源的Qwen-7B,Qwen-14B的整体容量在增加,推理、算数等各种能力也会有所增强,在12个权威测评中的结果也有全面提升。阿里云方面透露,Qwen-7B等模型在魔搭社区上线后,一个多月下载量破100万。随着Qwen-14B的开源,Qwen-7B也全新升级,核心指标最高提升22.5%。
阿里云对生态的重视,让算力更普惠、让AI更普及是阿里云的初衷,把AI发展方方面面的能力真正带到应用层面是阿里云的目标。阿里云将坚定不移地做开源,让技术成果更多地集成到业务上,和行业一起为模型的快速应用能够产生实际的使用价值而奋斗,同时也会做更多前沿的研究,包括通义千问等更多产品会陆续推出,把更多能力带给行业。
相关工具
相关文章
相关快讯
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16