一场突如其来的“疫情”并没有阻止对未来存储的探索,有人说未来已来,是说未来不是确定的概念,时长可长可短,但即便如此,对未来1~3市场进行预测,还是需要专业的眼光,需要高瞻远瞩。
作为国内数据存储的领导厂商,华为是如何看待未来存储的呢?为此,Dostor总编宋家雨对华为智能数据与存储领域副总裁张福鹏进行了专访。
倾向“智能时代存储”
谈到未来存储,张福鹏表示热词很多,但是华为想用“智能时代存储”进行概括。
“整个人类社会都在快速迈进智能社会,在这个过程当中,数据量迎来爆炸式增长。1个普通的手机用户每天消费数据量超过1GB,而自动驾驶汽车在进行训练时,每辆车每天将产生数据64TB,根据华为《全球产业展望GIV2025》预测,全球数据量将从2018年的33ZB快速增长到2025年的180ZB。数据正在成为企业乃至国家的核心,基于对数据有效利用构建起来的智慧政府、智慧金融、智慧工厂等较高提升了全社会的效率,越来越多的企业已经意识到数据基础设施是智能化成功的关键,而存储是数据基础设施的核心底座。过去我们习惯按照一些新技术热点、技术架构,以及新存储介质类型进行划分,随着经济社会从信息化迈向智能化,我们更倾向于结合市场需求变化理解和判断,‘智能时代存储’的表述更为贴切。”张福鹏说。
在华为的判断中,智能时代存储有如下几个方向:
首先是智能化,华为将其分为Storage for AI和AI in Storage其中,Storage for AI含义是说:未来存储要更好支撑企业利用智能技术,满足类似AI智能训练、应用的需要。AI in Storage是说存储本身也要应用AI技术,将AI融入存储全生命周期管理,让存储管理、性能、效率、稳定性更加出色。。
其次存储系统本身也要进行调整,例如全闪存,未来会更多针对低时延、高可靠、低TCO等应用场景,尽管也会有新存储介质引入带来竞争,但是未来存储主流会走向全闪存。如今,全闪存成为主流存储的使命还没有完成。
再有就是分布式存储。随5G智能时代而来海量数据AI、HPC、自动驾驶等高性能应用场景,需要提供一个高效率、低成本,面向EB级大容量的专有硬件的分布式存储。对于分布式存储来说,集约化与大规模扩展是其需要面对的挑战。
除此之外,未来在芯片和算法上会有变化。如何通过芯片、算法和总线技术突破冯.诺依曼计算体系架构,面向底层数据基础设施提供更多算力,来解决存储介质成本和效率问题,缩小存储和计算之间所存在的鸿沟,这些都需要专有硬件的存储来解决。类似Memory Fabric的概念也会让存储本身的架构面临变化。
最后是融合。未来存储需要与数据基础设施进行融合,包括支持异构芯片计算、打通多样性协议、与数据处理、大数据分析协同等,让数据处理成本更低,效率更高。例如,相比通用服务器提供的存储,数存一体化会让TCO更低,当中涉及到数据处理技术卸载(Offload)到存储;对象、大数据等多协议融合互通,实现大数据免搬迁,如此融合,会深刻影响存储系统的设计,也是存储效率提升的关键。
以上应该是对于未来存储的要求。
未来存储的技术基石
在华为看来,智能时代存储需要几个基石:
一个是极致性能和可靠性。面向核心生产交易场景,目前华为存储已经能够提供2000万IOPS,0.1毫秒的性能指标,即便如此,仍然不足够。因为随着5G时代的到来,宽带互联网应用会要求更高的存储性能。对此,存储系统更好匹配内存资源池化、多样性计算等技术方向。与此同时,多云部署会对系统级可靠性提出更高要求。
二是极致容量。华为认为极致容量要以闪存为主流,要求存储介质成本更低,以满足大容量、高性能的需求,其中,QLC NAND被寄予厚望。此外,发挥算法的优势,重删压缩技术也能够有效减小数据量,让存储系统拥有更好的可得存储容量。对于不同存储介质进行管理的ZNS(分域管理)技术、NVMe over Fabric替代FC网络让前端互联效率更高,以及针对归档、备份的蓝光、金纳米玻璃等存储介质,都是解决极致存储容量可以依赖的技术。
最后融合,如SAN/NAS协议融合、温/冷数据分级存储的融合,、芯片和架构的融合,以及与大数据软件的融合等。
多种存储形式
张福鹏表示未来存储会是多种存储形式并存,不会出现单一存储产品大一统的局面。换句话说,未来企业中的存储应该既包含面向高性能高可靠的集中式存储,也应该包含面向新业务的海量多样性数据分布式存储,两种存储相互结合,统一管理,支持企业数字化转型。
华为也为此做了很多有益尝试,如分布式存储的多协议融合,和数据全生命周期管理DMS(Data Management System)等。
在华为看来,未来会有几个存储技术的闪光点:
首先是互联技术,基于超高速互联新标准,通过类似HCCS超高速互联技术实现CPU、NPU异构处理器高速互联,构建了xPU间的统一Cache一致性架构,xPU之间可以进行直接内存访问,实现高速数据交互,提供万核的CPU资源动态管理。。
其次是Memory Fabric架构实现全闪存+ SCM(Storage Class Memory)内存资源的池化,提供微秒级的数据处理性能。这里需要强调的是,SCM介质包括了Optane、MRAM、ReRAM、FRAM、Fast NAND等。
在可靠性方面,牵涉到系统重构和数据迁移,全闪存存储的芯片级设计技术的进步将实现上层应用对于底层存储系统硬件的无感知。
小结
未来存储首先是用户业务需求的比拼,脚踏实地,因地制宜,才是最务实的态度,未来存储之争,惟有时间会给出正确的答案。对此,不妨拭目以待!