绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
基于 Colossal-AI 低成本复现 ChatGPT
大模型技术公开课 2023/05/24 19:00:00
课程讲师

新加坡国立大学硕士,师从尤洋教授,对大规模深度学习、AI System等领域有深入研究,是Colossal-AI最新开源方案 ColossalChat核心贡献者。

柳泓鑫
潞晨科技 技术 VP

新加坡国立大学硕士,师从尤洋教授,对大规模深度学习、AI System等领域有深入研究,是Colossal-AI最新开源方案 ColossalChat核心贡献者。

课程提纲
  • 大型语言模型的成本账
  • ChatGPT背后的 RLHF 训练流程复现
  • ColossalChat 的低成本训练及推理
  • 预训练大模型的训练推理加速方案
课程简介

5月24日晚7点,潞晨科技技术 VP 柳泓鑫将参与到「大型语言模型技术公开课」第一讲的直播中,并围绕主题《基于 Colossal-AI 低成本复现 ChatGPT》进行深度讲解。

Colossal-AI 是 AI 大模型低成本训练基础设施。自开源以来,Colossal-AI 已经多次在GitHub热榜位列世界第一,获得 GitHub Star 约3万颗。

对于火爆出圈的 ChatGPT, Colossal-AI 在最新的开源方案 ColossalChat 中,率先建立了包含监督数据集收集 -> 监督微调 -> 奖励模型训练 -> 强化学习微调的完整 RLHF 流程,并推出 ColossalChat。

ColossalChat 是首个最接近 ChatGPT 原始技术方案的实用开源项目,可显著降低显存需求,加快训练推理速度,以低成本实现类 ChatGPT 的落地与应用。目前 ColossalChat 已支持支持单卡、单机多卡、1750 亿参数等多个版本,用户可以从 Hugging Face 导入GPT-3,BLOOM等多种预训练大模型。

在本次公开课中,柳泓鑫首先会对大型语言模型的成本账进行计算梳理,之后深度讲解 ChatGPT 成功背后的 RLHF ,以及开源的、低成本的 ChatGPT 平替方案:ColossalChat。最后,他也将对预训练大模型的训练推理加速方案进行介绍。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...