新知榜官方账号
2023-09-19 03:12:28
Meta发布了LLaMA2,这是一种最先进的新型开放大语言模型(LLM)。LLaMA2代表LLaMA的下一代版本,并附带商业许可。LLaMA2有3种不同的尺寸-7B、13B和70B参数。与原始LLaMA相比,新的改进包括:使用2万亿个文本数据进行训练,允许商业用途,使用4096个默认上下文窗口(可以扩展),使用RoPE缩放4位量化,超越4ktoken限制70B模型采用分组查询注意力(GQA),适用于HuggingFaceHub。
有几个不同的游乐场可用于测试与LLaMA2Chat的交互:HuggingChat、HuggingFaceSpaces、Explorellamav2with_TGIPerplexity、7B-chat、13B-chat和70B-chat。这些提供了一种查看聊天机器人运行情况的简单方法。
如果你正在寻找特定的开源LLM,你会发现有很多变体。GPTQ版本、GGML版本、HF/基本版本。我们应该选择使用哪个版本?按一般规则:如果你有很多VRAM,请使用GPTQ,如果你的VRAM最小,请使用GGML,如果你想要原始模型,则使用基本的HuggingFace模型,而量化造成的智能损失可以忽略不计。
LLaMA2是一个基本的LLM模型,并根据在线公开数据进行了预训练。此外,Meta还发布了CHAT版本。CHAT模型的第一个版本是SFT(监督微调)模型。之后,LLaMA-2-chat通过人类反馈强化学习(RLHF)进行迭代改进。RLHF流程涉及拒绝采样和近端策略优化(PPO)等技术,以进一步完善聊天机器人。
Meta声称“Llama2在许多外部基准测试上都优于其他开源语言模型,包括推理、编码、熟练程度和知识测试”。您可以在拥抱开放LLM排行榜中找到有关性能的更多见解。
LLaMA2Chat是一种开放的对话模型。与LLaMA2Chat有效互动需要提供正确的提示和问题,以产生连贯且有用的响应。单轮和多轮对话的提示模板遵循模型的训练过程,如LLaMA2论文中所述。
LLaMA2是公开可用的,因此可以轻松使用PEFT等技术进行微调。有大量资源可用于训练您自己的LLaMA2版本。
LLaMA2可以使用HuggingFaceInferenceEndpoints等托管服务或通过AWS、GoogleCloud和MicrosoftAzure等云平台部署在本地环境(llama.cpp)中。使用文本生成推理和推理端点部署LLaMa2。
replicate提供了基于Llama2Chat在线微调的API接口,可以使用ReplicateAPI运行Llama2。
本文包含了LLaMA2的官方公告、论文、提示模板等相关资源。
相关工具
相关文章
推荐
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49
国产GLM-4.5把AI价格打到地板价,实测强到离谱!
2025-07-30 09:08