智猩猩

「DeepSeek大解读」系列公开课启动！前两期深入讲解DeepSeek V3/R1架构，以及PTX与CUDA

分类： DeepSeek

2025-02-10 17:52:00

DeepSeek“龙卷风”仍在持续拉爆中！

去年12月26日和今年1月20日，DeepSeek在不到一个月的时间内，连续发布并开源基座模型V3、推理模型R1。V3与R1这两个被誉为“国运级创新”的大模型，在全球范围内迅速引爆。

凭借算法和工程创新突破算力封锁的DeepSeek，不仅在全球范围内一举成为大模型领域OpenAI的最强挑战者，更是在推理模型领域一跃成为新晋开源王者，并在AGI进程的探索中进入到第一阵营。

DeepSeek在国内则是打破了大模型现有格局，开启遥遥领先局面。作为领军者，DeepSeek为国内从大模型、到生成式AI再到整个人工智能产业，不仅带来了前进的方向，更是注入了强大的信心。

而这一切都是始于DeepSeek在V3与R1中所做的创新工作，而对国内乃至世界，从技术到产业的影响也才刚刚开始。为此，智猩猩策划和开启「DeepSeek大解读」系列公开课，将邀请学术界和工业界的技术专家与大咖，解读DeepSeek的技术创新及价值，和工业界联动影响及进展。

第一期关注V3/R1采用的MoE架构。大模型+AI芯片专家、中存算董事长陈巍博士将于2月11日15点进行主讲，主题为《DeepSeek V3/R1架构的深度分析与深度思考》。陈巍博士将从MoE模型架构与低比特训练框架创新的角度，深入分析DeepSeek V3/R1的架构、训练流程和训练框架设计思想，并给出大模型发展路线和算力芯片范式共生的深度思考。

第二期解读 PTX与CUDA。中科院计算所处理器芯片全国重点实验室副研究员、计算所新百星赵家程博士将于2月13日19点进行报告讲解，题目为《PTX与CUDA：性能、兼容性与生态系统》。“DeepSeek绕开NVIDIA CUDA垄断”引起了巨大争议，进而把PTX推到了台前。赵家程博士将对GPGPU底层编程方法及其在LLM训练与推理中的应用展开讲解。

智猩猩「DeepSeek大解读」系列公开课的每一期都将由主讲、Q&A两部分组成，以直播形式进行。后续公开课也在准备中，敬请期待。

如何报名与入群

对于此次「DeepSeek大解读」系列公开课，有直播观看需求，可以扫描下方二维码添加小助手“小石头”进行报名，私信，发送“DeepSeek”，报名通过后将分享直播地址。

针对此次系列公开课的前两期，也分别组建了交流群。希望入群与更多同仁探讨的，也可以与“小石头”进行申请，申请时请备注第1期or第2期。