智谱AI发布全新的ChatGLM3大型模型及相关产品

新知榜官方账号

2023-11-01 16:27:25

智谱AI发布全新的ChatGLM3大型模型及相关产品

智谱AI在2023年的中国计算机大会上发布了全新的ChatGLM3大型模型及相关产品,这次的推出是对之前ChatGLM和ChatGLM2模型的重大突破。

与之前的模型不同,ChatGLM3采用了全新的多阶段增强预训练方法,并在44个中英文公开数据集测试中名列国内同类模型的第一。智谱AICEO张鹏在会上介绍了新品的功能和特点,并展示了最新上线的产品功能。

ChatGLM3的性能得到了极大的提升,其中包括MMLU提升了36%,CEval提升了33%,GSM8K提升了179%,BBH提升了126%。此外,ChatGLM3还增加了一些全新的功能,如:CogVLM-看图识语义,可以实现多模态理解能力,CodeInterpreter可以根据用户需求生成代码并执行,WebGLM可以自动在互联网上查找相关资料。

ChatGLM3的性能和逻辑能力都得到了极大的提升,并且集成了自研的AgentTuning技术,提升了模型的智能规划和执行能力。此外,ChatGLM3还推出了可在手机上部署的端测模型,支持多款手机和车载平台,甚至支持移动平台上CPU芯片的推理,速度可达20tokens/s。ChatGLM3的性能接近于ChatGLM2-6B模型的性能,在公开benchmark上得到了很好的表现。

ChatGLM3是一种推理框架,它基于高效的动态推理和显存优化技术。与目前最佳的开源实现相比,它的推理速度快2-3倍,推理成本降低50%。每千个tokens的成本仅为0.5分,这使得它成为目前最具成本效益的选择之一。

智谱清言是一种生成式AI助手,它已经成为国内首个具有代码交互能力的大模型产品。它可以处理数据生成图表、绘制图形代码、上传SQL代码分析等多种使用场景。此外,智谱清言还具备搜索增强能力,可以帮助用户整理出相关问题的网上文献或文章链接,并直接给出答案。CogVLM模型的加入提高了智谱清言的中文图文理解能力,接近于GPT-4V的图片理解能力。它能够回答各种类型的视觉问题,并完成复杂的目标检测和自动数据标注。

智谱AI的产品已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。此次推出的ChatGLM3及相关系列产品全面提升了自身的模型性能,为业界打造了更开放的开源生态,并进一步降低了普通用户使用AIGC产品的门槛。智谱AI的大模型必将加速人工智能的发展。

本页网址:https://www.xinzhibang.net/article_detail-18530.html

寻求报道,请 点击这里 微信扫码咨询

关键词

智谱AI ChatGLM3 模型性能

分享至微信: 微信扫码阅读

相关工具

相关文章