新知榜官方账号
2023-08-06 05:06:38
2023年2月20日,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,MOSS已由邱锡鹏教授团队发布,邀公众参与内测。2月21日,该平台发布公告,感谢大家的关注,同时也指出,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。moss的官方公告MOSS在介绍中写道:“MOSS的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。为此,复旦大学自然语言处理实验室正在加紧推进中文语料的清洗工作,并将清洗后的高质量中文语料用于下一阶段模型训练。科研团队相信,这将有效提升模型的中文对话能力。未来,科研团队将通过开源方式分享这项工作的成果,促进学术界和产业界对预训练语言模型的分析与研发。预训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。”
MOSS由复旦大学自然语言处理实验室发布,虽然已经内测,但还是一个非常不成熟的模型。MOSS的最大短板是中文水平不够高,主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。
从创始人的说法来说,只提到了“互联网上中文网页干扰信息如广告很多,清洗难度很大”,大概率就是百度擅长的搜索。ChatGPT模型的参数达1750亿,爬虫数据集5000亿个,经过数十轮的训练,上万外包数据标记员长达几年的人工标记,而且OpenAI公司由于需要计算能力成本太高只好投靠微软。推测这次就是想蹭蹭ChatGPT热度,结果引起国内报道以为出了重大科研成果,怕大家知道事实真相后不好收场,自己偷偷把服务器关了,然后等热度过去。闹剧一场!
相关工具
相关文章
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16