新知榜官方账号
2023-10-29 02:33:12
智谱AI在2023中国计算机大会(CNCC)上推出了全新的ChatGLM3基座大模型及其系列产品。这款最新的模型采用了创新的多阶段增强预训练方法,以实现更加充分的训练效果。智谱AI的首席执行官张鹏亲自进行了新品发布,并通过实时演示展示了产品的最新功能。
据介绍,通过使用更丰富的训练数据和优化的训练方案,ChatGLM3的性能得到了显著提升。与之前的ChatGLM2相比,MMLU提升了36%,CEval提升了33%,GSM8K提升了179%,BBH提升了126%。
此外,ChatGLM3还进行了针对GPT-4V的迭代升级,引入了一些全新的功能。其中包括具备多模态理解能力的CogVLM-看图识语义,在10余个国际标准图文评测数据集上取得了领先水平;代码增强模块CodeInterpreter能够根据用户需求生成并执行代码,自动完成数据分析、文件处理等复杂任务;网络搜索增强模块WebGLM-接入搜索增强,能够自动查找互联网上与问题相关的资料,并在回答时提供参考的相关文献或文章链接。ChatGLM3的语义能力和逻辑能力得到了极大的增强。
此外,ChatGLM3还集成了自研的AgentTuning技术,激活了模型的智能代理能力,特别是在智能规划和执行方面,相较于ChatGLM2提升了1000%;同时还实现了对国产大模型的原生支持,包括工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。除了以上功能,ChatGLM3还推出了可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,支持多款手机品牌,包括vivo、小米、三星等,甚至支持移动平台上CPU芯片的推理,速度可达20tokens/s。在精度方面,1.5B和3B模型在公开benchmark上的性能与ChatGLM2-6B模型相当。通过最新的高效动态推理和显存优化技术,ChatGLM3的推理框架在相同硬件和模型条件下,相较于其他开源实现,如伯克利大学的vLLM和HuggingFaceTGI的最新版本,推理速度提升了2-3倍,推理成本降低了一倍,每千tokens的成本仅为0.5分。这使得ChatGLM3成为当前最具竞争力和高效性能的大模型之一。
智谱AI的新一代ChatGLM3基座大模型以其强大的性能和丰富的功能,将为用户提供更加高效、智能的交互体验,并在各个领域展现出巨大的潜力。
相关工具
相关文章
推荐
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49
国产GLM-4.5把AI价格打到地板价,实测强到离谱!
2025-07-30 09:08
用AI批量生成治愈系漫画,月入2000+
2025-07-29 09:59
千亿市场规模背后,AI短剧商业化迎来爆发期?
2025-07-17 09:19
15个作品涨粉26万!AI历史账号又出王炸案例!
2025-07-09 09:37
亲测真香!这6个AI工具让工作效率翻倍,同事追着问链接
2025-06-17 16:21
FLUX.1 Kontext 一出,AI生图领域 “地震” 了!
2025-06-06 15:38
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15