未来计算有三大支柱,CPU和GPU已稳坐两席,最后有资格入选是谁?英伟达CEO黄仁勋给出了自己的答案:“第三颗主力芯片”是DPU。[1]
三大计算支柱角色各异。CPU相当于管家,负责思考处理各种业务;GPU相当于美工,专门处理各种图像处理工作;DPU相当于前台,负责打包、拆包各种数据[2]。DPU虽然是芯片界后生,但因市场规模可期,这两年热潮涌动,疯狂入局的全球新玩家,都想从这片海中取一勺。
本文是“果壳硬科技”策划的“国产替代”系列第五篇文章,关注DPU国产替代。在本文中,你将了解到:DPU是什么,DPU能做什么,这一概念的发展历史,国产DPU的机会。
疯狂的DPU赛道
DPU(Data Processing Unit)是一种拥有计算能力的智能网卡,用于分担CPU运行低效、GPU难以处理的网络、存储和安全等任务,以提升计算系统效率、降低系统总拥有成本(TCO)。[3]
国内DPU市场有多疯狂?创业公司赶集式落地和抢先宣发,是最直接的表现。
据果壳硬科技(ID:guokr233)统计,2020年~2022年,有超过10家Pre-A轮或A轮初创企业开始规划并陆续出货DPU产品,投资方不乏红杉、腾讯、百度、美团、字节跳动、中科创星等机构。
DPU相关国产厂商投融资情况,制表丨果壳硬科技
参考资料丨公开资料
由于DPU概念较新,市场导入正当时,国内DPU初创企业极其注重产品的设计研发和量产速度。
DPU相关国产厂商,制表丨果壳硬科技
“赶工”并非浮躁,而是因为现有海外产品本身单价贵,加之出货量小,代理购买会进一步增加成本。更重要的是,处于探索阶段的海外公司,产品也不是很完善,国产DPU这一赛道机会非常大。
芯启源董事长兼CEO芦笙曾向笔者介绍,DPU是兵家必争之地,目前世界前五的巨头都在积极布局,谁占领了这篇领地,就占领了整个数据中心和网络中心的平台。
不仅如此,DPU的需求量还在持续攀升,预计全球DPU市场规模在2024年将达100亿美元[4],其中中国DPU市场规模将从2022年超10亿美元增长至2025年37.41亿美元,复合增长率超过50%。[5]
各大投资机构也看好DPU赛道,认为它是下一代数据中心的枢纽和是刚需,拥有数百亿美元的增量价值。[6]
为什么一定是DPU
DPU是怎么火起来的?
是因为CPU性能增加赶不上数据产生的速度:据第一财经数据,2010年以前,网络带宽年化增长约30%,现在已提升至45%,而CPU的性能增长从10年前的23%现在已经降到3%[7]。这给了DPU机会。
最开始,网络相关介入工作是由基础网卡(Network Interface Card,简称NIC)负责,但为了处理网络协议,它会挤占一些CPU算力,同时它只拥有一些非常基本的任务卸载功能。[8]
为了卸载掉这些挤占的资源,智能网卡(SmartNIC)应运而生。网卡变得智能,需要加载运行代码,为此会配备额外的计算能力和板载存储器[9],以此降低网络互联、安全、虚拟化、内存访问等对CPU资源的消耗,为应用提供更多的CPU资源[10]。
这种智能网卡也早已部署至数据中心内。从2015年起,亚马逊[11]、微软[12]都曾先后在自己业务中部署智能网卡。
既然有了智能网卡,为什么还要DPU?因为DPU支持更多功能,包括带宽压缩、安全加密、网络功能虚拟化等,虽然这些功能对于普通用户存在感稀薄,但它们是现有日常应用更高效、更安全、更实时的保障[13]。搭载这些功能的DPU,能比智能网卡更好地解决网络协议处理、数据安全、算法加速等问题,同时这些功能是CPU做不好、GPU做不了的。[14]
DPU发展的三个阶段
图源丨专用数据处理器(DPU)技术白皮书,中国科学院计算技术研究所,鄢贵海等
虽然DPU是如此强大,但它只是CPU的助手。
数字芯片发展至今,“CPU已经很难做好所有事情”已成为行业共识,但它却又不可或缺。芯片工程师老石表示,在算法加速领域论文中,CPU就是悲催的存在,动辄比CPU强几倍、几十倍、上百倍的器件比比皆是。但任由时光流动,CPU依旧挺立在数据中心的王座,只不过旁边多了GPU,还有一个DPU蠢蠢欲动。[15]
上海矩向科技CEO、前UCloud芯片和硬件研发负责人黄朝波则分析,CPU、DPU和GPU三者既相互协作,又相互竞争。传统观点认为,DPU仅仅充当CPU的任务卸载,但按照软硬件融合观点来看,DPU与嵌入式CPU/GPU构成了超异构计算平台,独立CPU/GPU又是DPU的拓展。[16]
DPU的作用,图源丨Socnoc[17]
现有DPU市场非常粗放
DPU诞生的背后,是曲折而又折腾的命名拉锯战,这导致当前DPU市场非常粗放,标准良莠不齐,定位和市场策略百花齐放。
2019年,Fungible将DPU定义为一种新型数据处理单元,但在当时并没有砸出水花。紧接着,英伟达在2020年6月收购Mellanox,把其原IPU系列(同样功能不同名称产品)重新包装为DPU,并在2020年10月开始大张旗鼓地宣传[18],这才让DPU被众人熟知。2021年6月,英特尔发布自己的DPU,但却改名为“基础设施处理器”(IPU)。[19]
DPU的发展历史,制表丨果壳硬科技
之后,业界又对DPU中的“D”有了三种新的解读,包括Data、Datacenter、Data-centric,分别侧重数据、数据中心、数据为中心。[20]
对DPU的不同解读
对DPU命名上的不一致,导致厂商的市场策略拥有不同的理解:英伟达(即Mellanox)面向数据安全、网络安全、存储卸载,Fungible面向网络、存储、虚拟化,英特尔、博通(Broadcom)面向交换机和路由器芯片,美满(Marvall)面向5G基带,Pensando面向支持P4的软件定义网络(SDN)。[21]
DPU竞争格局,图源丨赛迪顾问[22]
这种定位的差异,导致不同厂商在选择架构时也存在不同的理解,目前分为SoC(Arm与ASIC协同架构)、FPGA、ASIC三种主要技术形态。基于FPGA的DPU拥有最佳的灵活性,但吞吐量、功耗在一定程度上受到限制;随着带宽变高,基于ASIC的DPU需求将会增加;对于更复杂的、更广泛的用例,基于SoC的DPU拥有良好的性价比、易于编程且高度灵活性。
智能网卡不同技术实现参数对比,图源丨赛迪顾问[22]
这种差异就会引发两个问题,一是DPU究竟要做什么,如何与计算平台做衔接及对业务场景的理解,二是技术方案究竟要怎么选择。[23]
国产DPU该如何突围
由于DPU是一个新生事物,整个行业的需求各异、体系封闭的局面短期内并不会发生改变[21]。与此同时,DPU产品在全球市场上尚未真正实现规模化和商业化,这种高度整合化的器件打造难度非常高,现在已有产品并不能满足行业对DPU在通用领域的期待[24]。另外,DPU市场客户需求分散和不单一进一步加剧应用场景和架构的差异化。[25]
英特尔曾向笔者豪言:“DPU/IPU显然是一个很大的市场,但它渐渐不再是一个初创公司可以霸占的市场,而是一个由大公司主导的市场。”一直以来,对CPU非常有自信的英特尔也进入这一市场,说明所有计算都由CPU处理的时代已一去不复返,也足以说明这一领域究竟有多么重要。
由于DPU是由国际巨头提出的概念,并优先量产产品,现有市场也主要由它们包揽,这种情况下,国产DPU初创企业该如何生存?
首先,应该对应用场景有更深刻的理解。“DPU需要的是一个崭新的单元,而并非在原有交换机或CPU基础上拼凑组合[23]。”大禹智芯CEO李爽认为,不能简单地把DPU定义成一颗芯片,而是要看作一个系统,是一种架构转移。设计出一款有竞争力又好用的DPU,对场景的深刻理解是关键。[26]
无独有偶,IDG资本合伙人李骁军也表示,DPU领域需要充分理解大规模云厂商业务需求、定义架构特性,还要具备大芯片的工程实现能力。[27]
其次,用不同方案适配不同客户。芯谋高级分析师张彬磊认为,国内DPU企业更适合通过FPGA和NP等可适用性较好的方案,进入中小客户市场。[25]
最后,差异竞争,快速迭代。赛迪顾问集成电路产业研究中心分析师孙卓异建议,国内DPU采取差异化竞争思路,加快自主研发进程,加快产品的迭代速度,并在商业模式上找到细分产品角度创新。[25]
References:
[1] NVIDIA:What Is a DPU?.2020.5.20.https://blogs.nvidia.com/blog/2020/05/20/whats-a-dpu-data-processing-unit/
[2] 半导体行业观察:大有可为的DPU芯片.2021.4.8.https://mp.weixin.qq.com/s/tBP2HYK0nfYY6ZC0afJb-A
[3] 中国科学院计算技术研究所:中科院计算所牵头发布DPU技术白皮书.2021.10.21.http://www.ict.cas.cn/xwgg/jssxw/202110/t20211021_6226618.html
[4] 云豹智能Jaguarmicro:云豹智能发布全功能云霄DPU网卡,引领数据中心新趋势.2021.12.15.https://mp.weixin.qq.com/s/y5gpY6_3vrtUvU08-c1v8Q
[5] 开源证券资管:行业观察丨云计算时代算力需求提升-DPU赛道初见端倪.2022.3.9.https://mp.weixin.qq.com/s/EaZ-3fr4ZMoky3pfG1tUQQ
[6] 天天IC:资本推动下的DPU“芯”战场 ,数亿元已成投资标配?.2021.8.21.https://mp.weixin.qq.com/s/t2VIA2CAsvqZ3H29O77cMA
[7] 来莎莎.DPU:呼之欲出的百亿赛道[N].第一财经日报,2021-12-30(A10)
[8] 软硬件融合:如何区分SmartNIC和DPU的定义?STH NIC分类框架介绍.2021.8.31.https://mp.weixin.qq.com/s/0wohV_OIvi3Tubn1q5daEw
[9] Xilinx赛灵思官微:SmartNIC 与普通的 NIC 有哪些显著性差异?.2020.10.10.https://mp.weixin.qq.com/s/c9yh1EnF0FpA-c-uStTPcg
[10] 中智观察:AWS/阿里云纷纷自研,英特尔/英伟达竞相布局,DPU有何魔力?.2021.8.18.https://mp.weixin.qq.com/s/MyqEt_kCSFbdYhvXviyMfA
[11] 国际电子商情:DPU市场,一片混战.2021.12.20.https://mp.weixin.qq.com/s/BPOGI1MpvtnUaauB5L2Tmg
[12] 21ic电子网:80%云服务商面临的“联网危机”,为何必须是FPGA?.2020.3.9.https://www.21ic.com/article/697539.html
[13] 赵广立.计算芯片“新贵”DPU,前路几何[N].中国科学报,2021-11-04(003)
[14] 张心怡.数据中心“第三颗主力芯片”DPU打响卡位战[N].中国电子报,2022-01-18(007)
[15] 老石谈芯:聚光灯下的DPU:如何开启一个时代.2021.11.05.https://mp.weixin.qq.com/s/ObRQDIpFdFtWQQ2EhC06Rg
[16] iTalk沙龙:又是数亿元融资!出道即巅峰的DPU到底是什么?.2021.12.28.https://mp.weixin.qq.com/s/tZZB8TOpzPCom7HIwsNHCg
[17] Socnoc官方网站:https://www.socnoc.ai/
[18] 量子位:英伟达一大波硬件来袭:今日GTC发布专业GPU与DPU,为收购ARM将在英国建超算.2020.10.6.https://mp.weixin.qq.com/s/aQYgo5IWh9Aub5ooGjettg
[19] 知IN:英特尔推出全新的基础设施处理器(IPU).2021.6.15.https://mp.weixin.qq.com/s/7cxb-CyCmSo7Yq9oaOP9fg
[20] 赵广立.计算芯片“新贵”DPU,前路几何[N].中国科学报,2021-11-04(003)
[21] 鄢贵海等.DPU:以数据为中心的专用处理器[J].《中国计算机学会通讯》,2021,17(10)
[22] 赛迪顾问股份有限公司:中国DPU行业发展白皮书.2021.12.9.https://microsite-wx-industries.nvidia.cn/Uploads/20211209/61b1809e68fba.pdf
[23] 中科创星:「大禹智芯」完成数千万元Pre-A轮融资,国内首个25G DPU产品进入商业化|创星Portfolio.2021.7.9.https://mp.weixin.qq.com/s/sVIsuTHlGMJou26tva4clw
[24] 铅笔道:“大禹智芯”融资数千万 研发国内首个25G DPU产品进入商业化.2021.7.9.https://www.pencilnews.cn/p/39233.html
[25] 许子皓.多家入局路线不一 DPU上演差异化竞争[N].中国电子报,2021-08-13(008)
[26] 大禹智芯:深入浅出看DPU:为什么它是时代之需?.2021.11.22.https://mp.weixin.qq.com/s/1NGM-Ran0NqSQ9GiZO1M4A
[27] 云脉芯联:云网融合“芯”势力,云脉芯联获数亿元天使轮投资.2021.10.22.https://mp.weixin.qq.com/s/rtr_lYLSHIOVBzGwpRDWaw