新知榜官方账号
2023-07-06 09:10:25
LLaMA、Alpaca和ColossalChat系列模型是由MetaAI和Stanford研究者发布的大型语言模型,本文将从多个角度进行介绍。
LLaMA是由MetaAI发布了一款全新的大型语言模型,共有7B、13B、33B、65B四种版本。Alpaca是在LLaMA基础上微调得到的7B模型,使用self-instruct提供的175个prompts,调用OpenAI的text-davinci-003模型,利用OpenAI的模型来产生有价值的instructions。将OpenAI性能完备的模型作为Teacher,来指导参数更少的Alpaca模型进行训练,大幅降低了训练成本。
Alpaca-lora是在Alpaca的基础上把训练方式改成用lora训练。LoRA(Low-RankAdaptation)技术是在原始PretrainedWeights旁边增加一个旁路,做一个降维再升维的操作,来模拟所谓的intrinsicrank。PEFT(Parameter-EfficientFine-Tuning)方法旨在解决模型变得越来越大,在消费级硬件上对模型进行全部参数的微调变得不可行。HuggingFace开源了一个高效微调大模型的PEFT库,目前包含LoRA,PrefixTuning,PromptTuning,P-Tuning四种算法。更多类似模型有Baize(白泽)、Luotuo(骆驼)和Koala(考拉)等。
ColossalChat是第一个基于LLaMA预训练模型开源完整RLHFpipline实现,包括有监督数据收集、有监督微调、奖励模型训练和强化学习微调。通过提供高质量的数据,ColossalChat可以实现更好的对话互动,也可以支持中文。
微信扫码咨询
相关工具
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49