ChatGPT背后的大规模预训练模型GPT-3.5能力强大,领先国内大模型一个代差

新知榜官方账号

2023-10-03 02:44:45

ChatGPT背后的大规模预训练模型GPT-3.5能力强大,领先国内大模型一个代差

ChatGPT背后的大规模预训练模型GPT-3.5能力强大,领先国内大模型一个代差。国内大模型百花齐放,如果要追赶并生产出类ChatGPT产品,首先要有能跟国际比肩的高性能基座模型,并在基座模型上优化。与此同时要有长期投入的环境,解决高端GPU算力“卡脖子”问题。

ChatGPT还存在不可避免的缺陷:常识缺失。究其原因,OpenAI在训练ChatGPT时,每一次进步都是算法+数据巧妙设计的结果,但这些训练过程都没有考虑常识知识的加入。ChatGPT的火爆,已经引起了国内AI界的热烈讨论。

“全能网友”ChatGPT火出圈,国际科技巨头布局AI聊天机器人,国内大小企业能否迎头赶上?差距在哪?成立于2019年的人工智能企业北京智谱华章科技有限公司(下称“智谱AI”)CEO张鹏2月7日对澎湃科技(www.thepaper.cn)表示,ChatGPT背后的大规模预训练模型GPT-3.5能力强大,领先国内大模型一个代差。

国内大模型百花齐放,如果要追赶并生产出类ChatGPT产品,首先要有能跟国际比肩的高性能基座模型,例如类GPT-3模型。在基座模型上优化,包括加入代码的训练增强逻辑性,做监督性的训练、强化学习的训练和用户反馈的数据监督训练,或许能得到与ChatGPT背后的模型相媲美的大模型。

西安中科创星科技孵化器有限公司(下称“中科创星”)创始合伙人米磊认为,国内差距主要在于资金长期投入和投入环境上,“OpenAI(ChatGPT的创建者)从2015年开始研发至今,背后是坚持不懈的长期巨额资金投入,不管是热还是冷,都坚持不断创新。最后十年磨一剑,坐冷板凳把ChatGPT做出来了。”与此同时,当前国内面临的高端GPU算力“卡脖子”问题仍然待解。

通用人工智能是指具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。ChatGPT的出现能否说明人类已经接近通用人工智能?张鹏认为,它离真正的通用人工智能甚至认知智能仍有距离。通过大规模预训练模型技术,ChatGPT实现了部分认知推理能力和内容生成能力。但它仍然欠缺认知中严谨的知识和逻辑,欠缺生成结果的可解释性。究其原因,OpenAI在训练ChatGPT的时候历经从最基础的1750万基座模型GPT-3到加入代码的Code-Davinci-002再到加入了指令微调的InstructGPT,最后到最近加入强化学习的Text-Davinci-003和ChatGPT,每一次进步都是算法+数据巧妙设计的结果,但这些训练过程都没有考虑常识知识的加入。因此对于认知大模型,张鹏表示,或许可以通过加入记忆模块和自我反思机制,实现进一步突破。

ChatGPT曾在诱导下写出毁灭全人类的计划书,因此需要考虑监管问题。目前ChatGPT还存在不可避免的缺陷,暂时不太可能完全替代某一个职业,但随着用户量的急剧增加,给ChatGPT的反馈信息越来越多,模型迭代训练后,张鹏表示,未来或可替代简单重复、技术含量不大的工作。“总体上,目前技术已经跑在前头了,安全、法律、道德等层面对它的约束和应对还是要跟上。”

本页网址:https://www.xinzhibang.net/article_detail-15074.html

寻求报道,请 点击这里 微信扫码咨询

关键词

ChatGPT 大规模预训练模型 GPT-3.5 SEO 人工智能 模型

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯