复旦大学自然语言处理实验室发布MOSS内测,能否与ChatGPT媲美还需时日

新知榜官方账号

2023-08-06 05:06:38

复旦大学自然语言处理实验室发布MOSS内测,能否与ChatGPT媲美还需时日

2023年2月20日,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,MOSS已由邱锡鹏教授团队发布,邀公众参与内测。2月21日,该平台发布公告,感谢大家的关注,同时也指出,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。moss的官方公告MOSS在介绍中写道:“MOSS的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。为此,复旦大学自然语言处理实验室正在加紧推进中文语料的清洗工作,并将清洗后的高质量中文语料用于下一阶段模型训练。科研团队相信,这将有效提升模型的中文对话能力。未来,科研团队将通过开源方式分享这项工作的成果,促进学术界和产业界对预训练语言模型的分析与研发。预训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。”

MOSS由复旦大学自然语言处理实验室发布,虽然已经内测,但还是一个非常不成熟的模型。MOSS的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。

从创始人的说法来说,只提到了“互联网上中文网页干扰信息如广告很多,清洗难度很大”,大概率就是百度擅长的搜索。ChatGPT模型的参数达1750亿,爬虫数据集5000亿个,经过数十轮的训练,上万外包数据标记员长达几年的人工标记,而且OpenAI公司由于需要计算能力成本太高只好投靠微软。推测这次就是想蹭蹭ChatGPT热度,结果引起国内报道以为出了重大科研成果,怕大家知道事实真相后不好收场,自己偷偷把服务器关了,然后等热度过去。闹剧一场!

本页网址:https://www.xinzhibang.net/article_detail-9369.html

寻求报道,请 点击这里 微信扫码咨询

关键词

MOSS ChatGPT 自然语言处理 预训练语言模型

分享至微信: 微信扫码阅读

相关工具

相关文章