


DeepSeek“龙卷风”仍在持续拉爆中!
去年12月26日和今年1月20日,DeepSeek在不到一个月的时间内,连续发布并开源基座模型V3、推理模型R1。V3与R1这两个被誉为“国运级创新”的大模型,在全球范围内迅速引爆。
凭借算法和工程创新突破算力封锁的DeepSeek,不仅在全球范围内一举成为大模型领域OpenAI的最强挑战者,更是在推理模型领域一跃成为新晋开源王者,并在AGI进程的探索中进入到第一阵营。
DeepSeek在国内则是打破了大模型现有格局,开启遥遥领先局面。作为领军者,DeepSeek为国内从大模型、到生成式AI再到整个人工智能产业,不仅带来了前进的方向,更是注入了强大的信心。
而这一切都是始于DeepSeek在V3与R1中所做的创新工作,而对国内乃至世界,从技术到产业的影响也才刚刚开始。为此,智猩猩策划和开启「DeepSeek大解读」系列公开课,将邀请学术界和工业界的技术专家与大咖,解读DeepSeek的技术创新及价值,和工业界联动影响及进展。
第一期关注V3/R1采用的MoE架构。大模型+AI芯片专家、中存算董事长陈巍博士将于2月11日15点进行主讲,主题为《DeepSeek V3/R1架构的深度分析与深度思考》。陈巍博士将从MoE模型架构与低比特训练框架创新的角度,深入分析DeepSeek V3/R1的架构、训练流程和训练框架设计思想,并给出大模型发展路线和算力芯片范式共生的深度思考。
第二期解读 PTX与CUDA。中科院计算所处理器芯片全国重点实验室副研究员、计算所新百星赵家程博士将于2月13日19点进行报告讲解,题目为《PTX与CUDA:性能、兼容性与生态系统》。“DeepSeek绕开NVIDIA CUDA垄断”引起了巨大争议,进而把PTX推到了台前。赵家程博士将对GPGPU底层编程方法及其在LLM训练与推理中的应用展开讲解。
智猩猩「DeepSeek大解读」系列公开课的每一期都将由主讲、Q&A两部分组成,以直播形式进行。后续公开课也在准备中,敬请期待。
如何报名与入群
对于此次「DeepSeek大解读」系列公开课,有直播观看需求,可以扫描下方二维码添加小助手“小石头”进行报名,私信,发送“DeepSeek”,报名通过后将分享直播地址。
针对此次系列公开课的前两期,也分别组建了交流群。希望入群与更多同仁探讨的,也可以与“小石头”进行申请,申请时请备注第1期or第2期。