华为发布盘古大模型3.0版,将重塑千行百业

新知榜官方账号

2023-07-10 05:56:58

华为在开发者大会HDCCloud上发布了盘古大模型3.0版,目标是要重塑千行百业,提供面向行业的大模型系列。具体来说,盘古大模型是一个面向行业的大模型系列,包括「5+N+X」三层架构。其中,L0层包括NLP、视觉、多模态、预测、科学计算五个基础模型,提供满足行业场景中的多种技能需求。盘古3.0提供了100亿、380亿、710亿和1000亿参数等基础大模型,以匹配不同场景、时延、响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。

L1层是多个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自有的专用大模型。L2层提供了更多细化场景的模型,更专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供「开箱即用」的模型服务。

华为还提供了多种高效训练新技术,针对千亿级参数大模型的训练,华为提出了多种高效训练新技术。最后这个训练优化器,还入围了7月即将举行的AI顶会ACL的杰出论文奖。盘古大模型采用完全分层解耦设计,可以快速适配、快速满足行业需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对自有数据二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

华为表示,在AI管道上存在数十个不同的模型,匹配了多行业的不同诉求。基于此,文案生成,对话语音、代码生成,以及图像生成、编辑等能力都可以供人们快速调用上线。华为表示,盘古大模型易落地的优势,在于提供了解耦设计。「我们所有的大模型都共用了能力集,训练数据也进行了解耦。不管你希望使用310亿大模型,还是1000亿参数的大模型,都可以快速进行转换,」张平安表示。

在底层算力上,华为提供了基于昇腾的硬件,构建了昇腾芯片使能能力CANN,在这其上则是MindSporeAI框架和ModelArts机器学习平台。基于这样的全栈能力,华为提升了大模型构建、训练和部署的效率。华为使用自有算力设备,在昇腾云上,大模型的训练效率达到了业界主流GPU的1.1倍。硬件能力这样的算力也可以为外界所用。此次华为云还宣布在乌兰察布和贵安上线昇腾AI云服务,可提供每秒200亿亿次浮点运算能力。现在缺乏GPU的科技公司有了新的选择。据介绍,美团利用昇腾AI云服务,AI算子的工作效率提升了30%。昇腾云服务除支持华为自家的AI框架MindSpore外,还支持PyTorch、TensorFlow等主流AI框架,框架中的90%算子都可以通过华为的迁移工具从GPU平滑迁移到昇腾。

华为表示,盘古大模型已经深耕超过十个行业,服务400余个业务场景。在政务领域,盘古大模型可以实现对话理解,画面内容的分割和理解,并正确对于政务规则进行解释并提出建议。在金融行业,盘古大模型可以为柜台流程形成规范的操作指导,降低了单词业务办理的操作次数,每次办结时间缩短了5分钟以上。在制造业,盘古大模型可以实现订单信息和邮件的准确理解,转化为调度指令交由「盘古天筹求解器」,成为了未来三天的全局统筹最有规划。

华为还提供了AI自动编程能力,华为盘古的代码生成工具名叫CodeArts。它有三大核心能力:智能生成代码,智能问答和智能协同。在现场,华为展示了用CodeArtsSnap开发一个未完成的应用。首先,我们用对话方式提出需求,把需求复制到代码注释位置,就可以命令Snap直接完成目标任务的开发。我们可以让Snap解释代码的意义,生成测试用例,随后直接一句话就可以让它自动提交代码,进行流水线应用部署,AI还自动生成了Commit提交信息。

总之,华为盘古大模型具有易落地、面向行业、提供多种规模和能力集等优势,目标是要重塑千行百业。未来,我们将看到更多基于盘古大模型的应用。

本页网址:https://www.xinzhibang.net/article_detail-7274.html

寻求报道,请 点击这里 微信扫码咨询

关键词

华为 盘古大模型 AI 行业 深度学习

分享至微信: 微信扫码阅读

相关工具

相关文章