绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
0
0
新型存储ReRAM,能打破“存算墙”和“能耗墙”?
分类: 芯片
2022-05-12 20:19:54


存算一体打破"存算墙"和"能耗墙"

在我国西部,一座座数据中心正在拔地而起,为全国输送着源源不断的算力。但数据计算往往伴随着巨大的功耗,因此发展数据中心和实现[双碳]目标之间存在着巨大的矛盾。在后摩尔时代,单纯通过工艺制程的提升降低芯片功耗的路径也日渐捉襟见肘,已经接近摩尔定律的物理极限。但随着基于ReRAM的全数字存算一体架构大算力、低功耗、易部署芯片的研发和产业化,这一难题似乎有了新的解决思路。

基于忆阻器ReRAM技术的计算单元可以通过阻值器件的存储记忆特性,利用基础物理定律和原理完成海量的AI计算;通过存算一体的架构,可以节省把数据从内存单元逐层搬迁到计算单元的环节,从而得以节省因为数据搬迁而产生的大量衍生成本。这此类方式也符合国家对于碳中和、碳达峰的技术发展路线,改变了传统AI运算数据量需要带来巨大能耗的现状。

新型存储器对比中ReRAM的优势

目前,新型存储器主要有4种:相变存储器(PCM),铁电存储器(FeRAM),磁性存储器(MRAM),阻变存储器(ReRAM)。对比四种新型存储器,ReRAM在密度、工艺制程、成本和良率上具备明显优势。ReRAM的单元面积极小,可做到4F²,读写速度是NAND FLASH的1000倍,同时功耗下降15倍。以Crossbar和昕原半导体为例,其采用对CMOS友善的材料,能够使用标准的CMOS工艺与设备,对产线无污染,整体制造成本低。可以很容易地让半导体代工厂具备ReRAM的生产制造能力,这对于量产和商业化推动有很大优势。从密度、能效比、成本、工艺制程和良率各方面综合衡量,ReRAM存储器在目前已有的新型存储器中具备明显优势。

ReRAM国内外发展现状

在商业化上,Crossbar、昕原半导体、松下、Adesto、Elpida、东芝、索尼、美光、海力士、富士通等厂商都在开展ReRAM的研究和生产。在代工厂方面,中芯国际、台积电和联电都已经将ReRAM纳入自己未来的发展版图中。已量产的海外ReRAM存储器主要有Adesto的130nm CBRAM和松下的180nm ReRAM。松下(Panasonic)在2013年开始出货ReRAM,成为了世界第一家出货ReRAM的公司。接着,松下与富士通联合推出了第二代ReRAM技术,基于180nm工艺。而Adesto 一直在缓慢地出货低密度 CBRAM。国内,昕原半导体在Crossbar的基础上实现了技术核心升级和工艺制程的改进,实现28nm量产,并且已建成自己的首条量产线,拥有了垂直一体化存储器设计加制造的能力。 兆易创新和Rambus宣布合作建立合资企业合肥睿科微,进行ReRAM技术的商业化,但目前还无量产消息。

ReRAM迎来三大发展机遇

①物联网:AIoT需要数据的实时交互,因此不仅要求存储器低功耗,也需要高读写和低延迟。目前的NOR Flash存储密度低、容量小、功耗高,无法实现高写入速度。 而ReRAM在保证读性能的情况下,写入速度可提升1000倍,同时可实现更高存储密度和十分低的功耗,未来将会是取代NOR Flash成为万物智联时代存储器的最佳选择。

②智能汽车:未来单车存储容量将达到2TB-11TB,一辆L4/L5级自动驾驶汽车至少需要74GB DRAM和1TB NAND。 新型存储器中,ReRAM不仅满足高读写速度和存储密度的要求,同时延迟可降低1000倍,可满足未来智能驾驶高实时数据吞吐量。

③数据中心:ReRAM相较NAND可提升100倍的读写性能,同时保持更低的功耗和高存储密度,有望解决未来数据中心高能效比,低延迟的需求,实现更高性能的AI数据中心。

国产存储器有望弯道超车

新型存储器的核心,是在其开发中需要在传统CMOS工艺里增加一些特殊的材料或工艺,这些特殊材料或工艺的开发则需要经过大量实验及测试验证。传统CMOS代工厂或因囿于资源所限,迭代速度较慢,从而影响工艺开发进度,而国内各大科研院所虽可在实验室阶段加快迭代速度,但没有标准的12寸量产产线,实验成果往往很难走向量产。昕原自行搭建的28/22nm ReRAM(阻变存储器)12寸中试生产线就解决了上述问题。汲取了代工厂和实验室的长处,迭代速度快, 产线灵活,拥有自主可控的知识产权,使得ReRAM相关产品的快速实现变成了可能。

结尾

目前的ReRAM器件还未成熟,它还面临三个关键挑战:①基于高精度模数转换器的读出电路;②器件的非理想性,包括受单元间变化的器件的影响;③ReRAM设备中非线性的以及不对称电导更新后会严重降低训练的准确度。