八款开源大语言模型简介

新知榜官方账号

2023-07-28 16:46:57

八款开源大语言模型简介

本文简介了八款开源大语言模型,包括ChatGPT、LLaMA、StableLM、Alpaca、Dolly、Vicuna等,以及它们的特点和表现。

1. ChatGPT

ChatGPT是一款类似于聊天助手的开源大语言模型,由用户分享的跟LLaMA的对话数据微调得来,训练成本约为300美元。评估结果显示,Vicuna-13B在超过90%的情况下,都比LLaMA和斯坦福羊驼(StanfordAlpaca)表现要好。另外,其质量水平达到了OpenAIChatGPT和GoogleBard九成以上的水平。

2. LLaMA

LLaMA是一款开放和高效的基础语言模型,具有从70亿到650亿多种规模参数。LLaMA在数以万亿计的标记上训练而来模型,它的出现证明了,即使是完全使用公开的数据集也能训练出最先进的模型,而不必求助于专有数据集。实测数据显示,LLaMA-13B在大多数基准测试上都超过了GPT-3,而LLaMA-65B与最好的模型Chinchilla-70B和PaLM-540B相比也有竞争力。

3. StableLM

StableLM是一款由Stability开发的大语言模型,包含6个不同大小的模型,目前开放下载的只有30亿和70亿参数规模两种,150亿、300亿以及650亿的还在开发当中,1750亿参数的还在计划当中。StableLM-Alpha是从ThePile数据集基础上训练而来的,将原始的Pile数据集放大了三倍,用1.5万亿个文本做训练。

4. Alpaca

Alpaca是斯坦福大学关于指令跟随语言模型的研究结果,目前,Alpaca只用于学术研究,禁止任何商业使用。Alpaca7B是一个从LLaMA7B模型中微调出来的关于52K指令跟随演示的模型。评估显示,Alpaca的表现与OpenAI的text-davinci-003在质量上相似,同时模型本身又出奇的小,可以以很低的成本复制。

5. Dolly

Dolly由Databricks开源的指令优化的大语言模型。Dolly2.0是一个基于EleutherAIpythia模型系列的12B参数的语言模型,特意在一个新的、高质量的人类生成的指令跟随数据集上进行微调得来。Dolly目前有两个版本,Dolly1.0用了OpenAI的数据所以没法开源。最新的Dolly2.0开源的很彻底,可供研究和商业使用。

6. Vicuna

Vicuna是一款类似ChatGPT的聊天助手,基于用户分享的跟LLaMA的对话数据做微调而得来,训练成本约为300美元。评估结果显示,Vicuna-13B在超过90%的情况下,都比LLaMA和斯坦福羊驼(StanfordAlpaca)表现要好。另外,其质量水平达到了OpenAIChatGPT和GoogleBard九成以上的水平。

7. ChatGLM

ChatGLM是清华团队开源的中英双语对话语言模型,结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4量化级别下最低只需6GB显存)。经过约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62亿参数的ChatGLM-6B虽然规模不及千亿模型,但大大降低了用户部署的门槛,并且已经能生成相当符合人类偏好的回答。

8. OpenAssistant

OpenAssistant是一个面向所有人的对话式AI,其目标是成为像StableDiffusion一样有影响力的开源模型,因此,它也是免费可用的,其目标是在消费级硬件上运行。OpenAssistant是由LAION和全球贡献者组织的项目。官网介绍中提到,OpenAssistant处于研发的初期阶段,正在研究将RLHF应用于LLM。除了像用ChatGPT一样用它,用户也可以对模型生成的数据进行评价,公户贡献的这些反馈有助于提高模型的公正客观,少一点偏见。

本页网址:https://www.xinzhibang.net/article_detail-8835.html

寻求报道,请 点击这里 微信扫码咨询

关键词

开源 大语言模型 ChatGPT LLaMA StableLM Alpaca Dolly Vicuna

分享至微信: 微信扫码阅读

相关工具

相关文章