新知榜官方账号
2023-07-28 16:46:57
本文简介了八款开源大语言模型,包括ChatGPT、LLaMA、StableLM、Alpaca、Dolly、Vicuna等,以及它们的特点和表现。
ChatGPT是一款类似于聊天助手的开源大语言模型,由用户分享的跟LLaMA的对话数据微调得来,训练成本约为300美元。评估结果显示,Vicuna-13B在超过90%的情况下,都比LLaMA和斯坦福羊驼(StanfordAlpaca)表现要好。另外,其质量水平达到了OpenAIChatGPT和GoogleBard九成以上的水平。
LLaMA是一款开放和高效的基础语言模型,具有从70亿到650亿多种规模参数。LLaMA在数以万亿计的标记上训练而来模型,它的出现证明了,即使是完全使用公开的数据集也能训练出最先进的模型,而不必求助于专有数据集。实测数据显示,LLaMA-13B在大多数基准测试上都超过了GPT-3,而LLaMA-65B与最好的模型Chinchilla-70B和PaLM-540B相比也有竞争力。
StableLM是一款由Stability开发的大语言模型,包含6个不同大小的模型,目前开放下载的只有30亿和70亿参数规模两种,150亿、300亿以及650亿的还在开发当中,1750亿参数的还在计划当中。StableLM-Alpha是从ThePile数据集基础上训练而来的,将原始的Pile数据集放大了三倍,用1.5万亿个文本做训练。
Alpaca是斯坦福大学关于指令跟随语言模型的研究结果,目前,Alpaca只用于学术研究,禁止任何商业使用。Alpaca7B是一个从LLaMA7B模型中微调出来的关于52K指令跟随演示的模型。评估显示,Alpaca的表现与OpenAI的text-davinci-003在质量上相似,同时模型本身又出奇的小,可以以很低的成本复制。
Dolly由Databricks开源的指令优化的大语言模型。Dolly2.0是一个基于EleutherAIpythia模型系列的12B参数的语言模型,特意在一个新的、高质量的人类生成的指令跟随数据集上进行微调得来。Dolly目前有两个版本,Dolly1.0用了OpenAI的数据所以没法开源。最新的Dolly2.0开源的很彻底,可供研究和商业使用。
Vicuna是一款类似ChatGPT的聊天助手,基于用户分享的跟LLaMA的对话数据做微调而得来,训练成本约为300美元。评估结果显示,Vicuna-13B在超过90%的情况下,都比LLaMA和斯坦福羊驼(StanfordAlpaca)表现要好。另外,其质量水平达到了OpenAIChatGPT和GoogleBard九成以上的水平。
ChatGLM是清华团队开源的中英双语对话语言模型,结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4量化级别下最低只需6GB显存)。经过约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62亿参数的ChatGLM-6B虽然规模不及千亿模型,但大大降低了用户部署的门槛,并且已经能生成相当符合人类偏好的回答。
OpenAssistant是一个面向所有人的对话式AI,其目标是成为像StableDiffusion一样有影响力的开源模型,因此,它也是免费可用的,其目标是在消费级硬件上运行。OpenAssistant是由LAION和全球贡献者组织的项目。官网介绍中提到,OpenAssistant处于研发的初期阶段,正在研究将RLHF应用于LLM。除了像用ChatGPT一样用它,用户也可以对模型生成的数据进行评价,公户贡献的这些反馈有助于提高模型的公正客观,少一点偏见。
微信扫码咨询
相关工具
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49