- 课程回放
基于 Colossal-AI 低成本复现 ChatGPT
大型语言模型技术公开课 2023/05/24 19:00:00
课程讲师
课程提纲
- 大型语言模型的成本账
- ChatGPT背后的 RLHF 训练流程复现
- ColossalChat 的低成本训练及推理
- 预训练大模型的训练推理加速方案
课程简介
5月24日晚7点,潞晨科技技术 VP 柳泓鑫将参与到「大型语言模型技术公开课」第一讲的直播中,并围绕主题《基于 Colossal-AI 低成本复现 ChatGPT》进行深度讲解。
Colossal-AI 是 AI 大模型低成本训练基础设施。自开源以来,Colossal-AI 已经多次在GitHub热榜位列世界第一,获得 GitHub Star 约3万颗。
对于火爆出圈的 ChatGPT, Colossal-AI 在最新的开源方案 ColossalChat 中,率先建立了包含监督数据集收集 -> 监督微调 -> 奖励模型训练 -> 强化学习微调的完整 RLHF 流程,并推出 ColossalChat。
ColossalChat 是首个最接近 ChatGPT 原始技术方案的实用开源项目,可显著降低显存需求,加快训练推理速度,以低成本实现类 ChatGPT 的落地与应用。目前 ColossalChat 已支持支持单卡、单机多卡、1750 亿参数等多个版本,用户可以从 Hugging Face 导入GPT-3,BLOOM等多种预训练大模型。
在本次公开课中,柳泓鑫首先会对大型语言模型的成本账进行计算梳理,之后深度讲解 ChatGPT 成功背后的 RLHF ,以及开源的、低成本的 ChatGPT 平替方案:ColossalChat。最后,他也将对预训练大模型的训练推理加速方案进行介绍。
精彩问答
提问
提问
