ColossalChat：一个开源的ChatGPT克隆方案

新知榜官方账号

2023-07-07 03:58:46

ColossalChat：一个开源的ChatGPT克隆方案

ColossalChat是一个开源的ChatGPT克隆方案，包含约10万条问答的中、英双语数据集，以及完整RLHF流程的类Chat模型复现方案。ColossalChat能够快速跟进ChatGPT完整RLHF流程复现，离不开AI大模型基础设施Colossal-AI及相关优化技术的底座支持。通过ColossalChat，科研人员和中小企业也能独立训练部署自己的会话系统。

生成式AI正以“天”为单位，快速迭代，持续狂飙！然而，OpenAI并未将其开源，它们背后的技术细节有哪些？如何快速跟进、追赶并参与到此轮技术浪潮中？如何降低AI大模型构建和应用的高昂成本？如何保护核心数据与知识产权不会因使用第三方大模型API外泄？作为当下最受欢迎的开源AI大模型解决方案，Colossal-AI率先建立了包含监督数据集收集->监督微调->奖励模型训练->强化学习微调的完整RLHF流程，以LLaMA为基础预训练模型，推出ColossalChat，是目前最接近ChatGPT原始技术方案的实用开源项目！

ColossalChat的特点

开源了第一个完整的RLHFpipeline
采用了更多的指令数据，质量更好，范围更大
训练流程集成了Colossal-AI的诸多系统优化
自己采集了更多数据集：训练的英文一共24Mtokens，中文大约30Mtokens，总共约54Mtokens。其中ColossalChat自己收集的数据集英文6M，中文18Mtokens。

ColossalChat的训练流程

ColossalChat开源了基于LLaMA模型，复现训练ChatGPT三个阶段的完整代码，包括SFT模型训练、奖励模型训练和使用RL训练。在获得最终模型权重后，还可通过量化降低推理硬件成本，并启动在线推理服务。ColossalChat能够快速跟进ChatGPT完整RLHF流程复现，离不开AI大模型基础设施Colossal-AI及相关优化技术的底座支持，相同条件下训练速度相比Alpaca采用的FSDP(FullyShardedDataParallel)可提升三倍左右。

Colossal-AI的优化技术

Colossal-AI支持使用无冗余优化器(ZeRO)提高内存使用效率，低成本容纳更大模型，同时不影响计算粒度和通信效率。Gemini支持将优化器状态从GPU显存卸载到CPU内存或硬盘空间，以突破GPU显存容量限制，扩展可训练模型的规模，降低AI大模型应用成本。LoRA方法认为大语言模型是过参数化的，而在微调时，参数改变量是一个低秩矩阵。因此，可以将这个矩阵分解为两个更小的矩阵的乘积。在微调过程中，大模型的参数被固定，只有低秩矩阵参数被调整，从而显著减小了训练所需的参数量，并降低成本。GPTQ量化为降低推理部署成本，Colossal-AI使用GPTQ4bit量化推理。在GPT/OPT/BLOOM类模型上，它比传统的RTN(rount-to-nearest)量化技术能够获得更好的Perplexity效果。相比常见的FP16推理，它可将显存消耗降低75%，只损失极少量的吞吐速度与Perplexity性能。

结语

借鉴开源社区的成功经验，Colossal-AI欢迎各方参与共建，拥抱大模型时代！可通过以下方式联系或参与：1.在GitHub发布issue或提交pullrequest(PR)2.加入Colossal-AI用户微信或Slack群交流3.发送正式合作提案到邮箱youy@comp.nus.edu.sg

本页网址：https://www.xinzhibang.net/article_detail-6617.html

寻求报道，请

关键词

ColossalChat ChatGPT GPT-4 RLHF AI大模型开源

分享至微信：

相关工具

Replika

AI对话陪伴工具

ChatGLM

开源的、支持中英双语的1300亿参数的对话语言模型

通义千问

阿里巴巴最新推出的类ChatGPT响应人类指令的大模型

MOSS

复旦大学团队开发的对话式大型语言模型

Google Bard

Google推出的AI聊天对话机器人Bard

ChatGPT

OpenAI旗下AI对话工具

WhatsApp即将推出人工智能聊天机器人

WhatsApp即将推出人工智能聊天机器人作为全球最广泛使用的即时通讯应用之一，WhatsApp正准备迎来一次重大更新——集成的人工智能（AI）聊天机器人。这一功能目前正处于Beta测试阶段，预示着用户交互体验的新纪元。AI聊天机器人的引入今年9月，Meta，WhatsApp的母公司，宣布将在其旗下

分类标签 WhatsApp人工智能聊天机器人

11-22 22:34

关于大语言模型的综述

概述本文简述了中国人民大学教授WayneXinZhao等人撰写的关于大语言模型的综述，包括LLMs在预训练、适应调整、应用和能力评估等方面的研究进展。现有大模型的总体情况概览文章总结了最近发布的大模型，并展示了它们的开源情况。黄色的部分是开源的模型，可以看到，Meta、Google开源的模型较多。而

分类标签大语言模型预训练适应调整应用

11-17 04:52

GPU成为大模型算力军备竞赛新焦点，国产GPU能否率先打破藩篱？

背景在生成式AI开创的黄金时代，GPU将犹如翱翔于浩渺天空的翅膀，赋予AI大模型行业强大的推进力。英伟达一骑绝尘，AMD紧随其后，英特尔虎视眈眈，而国产GPU厂商在经过AI的洗礼之后，加之国产替代紧迫的“引力”，不能更不应缺席这场“盛宴”。尽管高端芯片的突围实非易事，但国产GPU能否好风凭借力，率先

分类标签 GPU大模型算力军备竞赛国产GPU英伟达

10-23 03:54

Colossal-AI发布全新Llama2训练微调推理方案，训练速度提升195%

Colossal-AI发布全新Llama2训练微调推理方案，训练速度提升195%近期，全球最大的大模型开发工具与社区Colossal-AI发布了一项令人瞩目的消息：全新的Llama2训练、微调、推理方案，可将700亿参数模型的训练速度提升了整整195%。大型语言模型的崛起，特别是ChatGPT等模型

分类标签 Colossal-AILlama2大模型开发工具训练微调推理方案

10-23 03:50

AI大模型的机遇和挑战

AI大模型的机遇和挑战过去数年，AI模型的参数发生了极大变化。尤洋指出，从2016年至2021年1月，AI模型的参数量是每18个月增长40倍；从2018年1月到2021年1月，AI大语言模型的参数量每18个月增长340倍。而相形之下，2016年1月至2021年1月间，GPU的内存增长每18个月仅有

分类标签 AI模型大模型训练Colossal-AI

10-07 10:03

华为智能AI音箱使用心得

华为智能AI音箱使用心得本文是对华为智能AI音箱的使用心得分享，包括开箱、操作介绍、煲机、音质试听以及体验等方面。开箱华为智能AI音箱的外包装以白色为底色，字体、图标均为淡黑色，包装虽不豪华，却给人清新脱俗的感觉，抢眼的是华为标志的那一抹红色。盒子的正面是简单几笔勾勒出来音箱的外形，上方是产品的名称

分类标签华为智能AI音箱音箱评测智能家居

10-02 02:36

谷歌2018年度研究回顾

谷歌2018年度研究回顾...（省略部分内容）

分类标签谷歌研究院AI机器学习深度学习健康数据集

10-02 02:34

复合元音/ai/的发音和嘴型变化

复合元音/ai/的发音和嘴型变化复合元音/ai/是英语中常见的一个双元音，发音时需要嘴的形状从开始到结束都要有变化。这个音的发音方式是/ai/，和单词“eye”发音一样。一些包含这个音的单词有：price，high，try。如果您在学习英语发音时想要练习这个音，可以跟着以下步骤操作：注

分类标签复合元音双元音发音嘴型变化英语发音英语学习

10-02 02:32

CHATGPT中文版——一款免费的AI聊天机器人

CHATGPT中文版——一款免费的AI聊天机器人CHATGPT中文版是一款让人感到兴奋的聊天机器人，它由OpenAI开发，拥有强大的自然语言处理技术。它的任务是理解你的问题并给予回应，就像你和一个朋友聊天一样。这让我们可以问它关于任何事情的问题，从学术知识到日常生活的疑问，都能找到答案。CHATGP

分类标签 CHATGPT中文版聊天机器人

09-29 10:12

Colossal-AI成功复现ChatGPT，开源完整基于PyTorch的ChatGPT复现流程

背景... ChatGPT技术分析... 使用Colossal-AI低成本复现ChatGPT... 背后优化核心系统... 开放协作...

分类标签 Colossal-AIChatGPTPyTorchAI大模型复现

09-29 10:10

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway