绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
0
0
「DeepSeek大解读」系列公开课启动!前两期深入讲解DeepSeek V3/R1架构,以及PTX与CUDA
分类: DeepSeek
2025-02-10 17:52:00

DeepSeek“龙卷风”仍在持续拉爆中!

去年12月26日和今年1月20日,DeepSeek在不到一个月的时间内,连续发布并开源基座模型V3、推理模型R1。V3与R1这两个被誉为“国运级创新”的大模型,在全球范围内迅速引爆。

凭借算法和工程创新突破算力封锁的DeepSeek,不仅在全球范围内一举成为大模型领域OpenAI的最强挑战者,更是在推理模型领域一跃成为新晋开源王者,并在AGI进程的探索中进入到第一阵营。

DeepSeek在国内则是打破了大模型现有格局,开启遥遥领先局面。作为领军者,DeepSeek为国内从大模型、到生成式AI再到整个人工智能产业,不仅带来了前进的方向,更是注入了强大的信心。

而这一切都是始于DeepSeek在V3与R1中所做的创新工作,而对国内乃至世界,从技术到产业的影响也才刚刚开始。为此,智猩猩策划和开启「DeepSeek大解读」系列公开课,将邀请学术界和工业界的技术专家与大咖,解读DeepSeek的技术创新及价值,和工业界联动影响及进展。

第一期关注V3/R1采用的MoE架构。大模型+AI芯片专家、中存算董事长陈巍博士将于2月11日15点进行主讲,主题为《DeepSeek V3/R1架构的深度分析与深度思考》。陈巍博士将从MoE模型架构与低比特训练框架创新的角度,深入分析DeepSeek V3/R1的架构、训练流程和训练框架设计思想,并给出大模型发展路线和算力芯片范式共生的深度思考。

第二期解读 PTX与CUDA。中科院计算所处理器芯片全国重点实验室副研究员、计算所新百星赵家程博士将于2月13日19点进行报告讲解,题目为《PTX与CUDA:性能、兼容性与生态系统》。“DeepSeek绕开NVIDIA CUDA垄断”引起了巨大争议,进而把PTX推到了台前。赵家程博士将对GPGPU底层编程方法及其在LLM训练与推理中的应用展开讲解。

智猩猩「DeepSeek大解读」系列公开课的每一期都将由主讲、Q&A两部分组成,以直播形式进行。后续公开课也在准备中,敬请期待。

 如何报名与入群

对于此次「DeepSeek大解读」系列公开课,有直播观看需求,可以扫描下方二维码添加小助手“小石头”进行报名,私信,发送“DeepSeek”,报名通过后将分享直播地址。

针对此次系列公开课的前两期,也分别组建了交流群。希望入群与更多同仁探讨的,也可以与“小石头”进行申请,申请时请备注第1期or第2期。