新知榜官方账号
2023-09-19 03:12:28
Meta发布了LLaMA2,这是一种最先进的新型开放大语言模型(LLM)。LLaMA2代表LLaMA的下一代版本,并附带商业许可。LLaMA2有3种不同的尺寸-7B、13B和70B参数。与原始LLaMA相比,新的改进包括:使用2万亿个文本数据进行训练,允许商业用途,使用4096个默认上下文窗口(可以扩展),使用RoPE缩放4位量化,超越4ktoken限制70B模型采用分组查询注意力(GQA),适用于HuggingFaceHub。
有几个不同的游乐场可用于测试与LLaMA2Chat的交互:HuggingChat、HuggingFaceSpaces、Explorellamav2with_TGIPerplexity、7B-chat、13B-chat和70B-chat。这些提供了一种查看聊天机器人运行情况的简单方法。
如果你正在寻找特定的开源LLM,你会发现有很多变体。GPTQ版本、GGML版本、HF/基本版本。我们应该选择使用哪个版本?按一般规则:如果你有很多VRAM,请使用GPTQ,如果你的VRAM最小,请使用GGML,如果你想要原始模型,则使用基本的HuggingFace模型,而量化造成的智能损失可以忽略不计。
LLaMA2是一个基本的LLM模型,并根据在线公开数据进行了预训练。此外,Meta还发布了CHAT版本。CHAT模型的第一个版本是SFT(监督微调)模型。之后,LLaMA-2-chat通过人类反馈强化学习(RLHF)进行迭代改进。RLHF流程涉及拒绝采样和近端策略优化(PPO)等技术,以进一步完善聊天机器人。
Meta声称“Llama2在许多外部基准测试上都优于其他开源语言模型,包括推理、编码、熟练程度和知识测试”。您可以在拥抱开放LLM排行榜中找到有关性能的更多见解。
LLaMA2Chat是一种开放的对话模型。与LLaMA2Chat有效互动需要提供正确的提示和问题,以产生连贯且有用的响应。单轮和多轮对话的提示模板遵循模型的训练过程,如LLaMA2论文中所述。
LLaMA2是公开可用的,因此可以轻松使用PEFT等技术进行微调。有大量资源可用于训练您自己的LLaMA2版本。
LLaMA2可以使用HuggingFaceInferenceEndpoints等托管服务或通过AWS、GoogleCloud和MicrosoftAzure等云平台部署在本地环境(llama.cpp)中。使用文本生成推理和推理端点部署LLaMa2。
replicate提供了基于Llama2Chat在线微调的API接口,可以使用ReplicateAPI运行Llama2。
本文包含了LLaMA2的官方公告、论文、提示模板等相关资源。
相关工具
相关文章
推荐
亲测真香!这6个AI工具让工作效率翻倍,同事追着问链接
2025-06-17 16:21
FLUX.1 Kontext 一出,AI生图领域 “地震” 了!
2025-06-06 15:38
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53