【IT168 专稿】不管是现实中的云还是现在IT界人人争相议论的“云”,在这之前,总给我一种渴望而不可及的感觉,尽管我坚信云必然是未来的发展趋势,但如何去实现,如何让云成功落地,对我而言,始终有种很飘渺的感觉。
当然我不是说,现在的技术就无法实现云,诸如EMC、IBM以及HP等IT巨头在这之前就推出过相关的私有云产品,这其中包括计算云和存储云,从我所在的角度而言,云存储给我的感觉总是很昂贵,如业内较为公认的惠普公司的3PAR存储系统,其作为惠普公司最高端的存储产品,似乎理所当然地给我一种“可望而不可及”的感觉。但云作为未来的一种必然趋势,要被市场广泛接受的话,必须具备亲民的特点,换而言之,就必须用一种较为普通(而非特殊)的方式出现。
标准化——云计算成功的必要条件
英特尔作为IT界的技术领头羊,其不仅对服务器行业有着深刻的影响力,而且这种影响力也逐渐延伸到了存储行业。而深究其原因,其中有一个很重要的因素,即标准化,用英特尔的话来说,就是开放的标准化,英特尔所构建的平台是一个开放的平台,并且是一个标准化的平台。而这也正是X86服务器大行其道的真正原因所在,这不仅仅是较低的投入成本一个因素。
▲上图为英特尔全球副总裁柏安娜女士在12日上午的主题演讲中展示的一张图。不管是服务器行业还是存储行业,英特尔的市场份额正在不断攀升,而随之而来的是用户成本的巨大节省
开放的标准化是英特尔成功的重要因素之一,这一点也是云模式成功的必要条件。数据量正不断增长,但与之紧密相关的IT投入成本却没有相应地增加,甚至有缩减的趋势。鉴于投入成本的影响,开放而标准化的硬件、架构必然要比专有的硬件、架构有吸引力得多,这不仅仅体现在成本方面,还体现在后期的运营、维护以及扩展。而基于英特尔开放的标准化硬件是实现云落地的非常好的选择,并且在此次的IDF大会上,英特尔也向我们展示了基于英特尔标准化硬件而设计的云存储参考架构。
${PageNumber}基于标准化硬件的英特尔云存储
在此次IDF大会上,英特尔公布了对未来数据中心的认识,未来的数据中心大致构建如下图所示:
▲如上图所示,未来数据中心之中,将分为计算资源和存储资源两大部分。而根据应用对于计算资源的不同需求,其大致又可分为专用服务器和虚拟化服务器两大部分,因为部分应用可能会对存储性能有着特别高的要求,所以在计算资源部分还有含有一部分存储资源,其通常用SSD来做为主存储或者缓存层;在存储资源部分,其有将分为两大部分,满足高IOPS需求的高性能存储和满足高容量需求的廉价存储
云存储服务的最大特点就是能够灵活扩展、按需使用,这一特点必然需要存储设施在能够提供足够的高性能的同时,还能满足高扩展需求。面对这样的需求,英特尔在存储方面展示了具备横向扩展能力的存储架构,具体如下图所示:
▲通过上图可以发现,在存储资源部分,英特尔实际将存储资源分成了两个部分,即将元数据与数据存储相分离。当应用发起请求后,其首先访问的元数据服务器,元数据服务器提供请求所需的数据存储位置并返回,存储客户端再根据这一地址访问存储服务器。这就使得存储服务器好像一本“书”,而元数据服务器则是这本“书”的“目录”
应用服务器、元数据服务器和存储服务器位于同一个机柜之内,当需要新的存储容量时,只需要简单地添加存储服务器就可实现性能与容量的增长。这种设计被英特尔命名为融合存储服务器,其硬件设计如下图所示:
▲英特尔融合存储服务器设计示意图
▲英特尔融合存储服务器硬件标准
从上面两张图可以看出,融合存储服务器均是采用英特尔标准化的硬件,如处理器,在需要较高运算能力时,可采用英特尔至强LC5600处理器;较低成本方面则可选用英特尔至强E3单路处理器,选择的余地较多。同时在容量方面,单个融合存储服务器机柜内可满配10块3.5英寸硬盘,最大可支持3TB SATA硬盘,这就使得单个机构的最大容量可达30TB。
并且,根据应用服务器对存储服务器性能的不同需求,英特尔将应用分为企业数据库、内容分发网络、应用数据存储、大型关系数据库、大型分析工具、高性能计算、大型对象存储以及备份与归档等八大存储使用模式,并根据这八大企业应用对存储性能的不同需求而分别对应三大云存储参考配置。关于英特尔云存储架构的更多信息可查看《IDF 2012:揭秘云存储使用模式与模型》,因为篇幅原因,在此略过。
${PageNumber}PCIe SSD——满足应用对高IOPS的需求
谈到硬盘的性能或者能提供的IOPS能力,PCIe SSD绝对是这方面的王者,其所能提供的性能和IOPS是其他硬盘(包括SAS或者SATA接口的SSD)所无法匹敌。如英特尔在IDF大会期间发布的910系列SSD,据其现场测试的数据显示,其单块PCIe SSD所能提供的IOPS大约接近2万,而当多块PCIe SSD组合起来,共同提供的IOPS并不是人们所想的“1+1=2”那么简单,如4块PCIe SSD共同提供的IOPS能够达到10万左右,几乎是单块PCIe SSD的4倍多,将近5倍。而这还是基于PCIe 2.0接口的,一旦采用PCIe 3.0的话,可预见其性能又将进一步提升。
英特尔910系列PCIe SSD由于采用的是PCIe 2.0技术,所以其能广泛地支持目前绝大多数的服务器,可将其之间插入服务器内部使用。据超微公司副总裁介绍,在超微所推出的服务器中,其最大可支持插入11块PCIe SSD,当然这是极端情况,超微公司副总裁表示,在一般的应用中,可插入7-9块PCIe SSD,剩余的PCIe 接口插入其他的HBA卡。英特尔910系列PCIe SSD提供400G和800G两种容量大小的固态硬盘,所以即使只插入8块,其所能提供的IOPS将达到一个恐怖的级别,特别适合有高性能需求的应用,这当中就包括了云存储使用模式。
并且,PCIe SSD的性能还有提升的空间,如采用PCIe 3.0接口,除此之外,就是NVMe标准。所谓的NVMe指的是一个针对使用PCI Express SSD的企业和普通客户端系统开发的可扩展的主机控制芯片接口标准。其主要包含了优化的寄存器接口和指令集两个部分。通过对NVMe的优化,将进一步提升PCIe SSD的读取速度。
如英特尔提供的910系列PCIe SSD的测试数据显示,其顺序读取的性能大概在2G/s,顺序写入性能在1G/s,提高高达180000次4k随机读取和最大75000次的4k随机写入。这都是基于PCIe 2.0技术下,如果采用PCIe 3.0技术,其性能将再次提升,这个设想并不遥远,要知道,英特尔最新发布的至强E5处理器中,在保留必须的PCIe 2.0的基础之上,加入了大量的PCIe 3.0的支持。
同时在NVMe优化方面,英特尔预计NVMe 1.1版本将在今年8月发布,并透露了相关的技术细节。在新的NVMe 1.1中,将提供写零指令、数据拷贝指令和多路访问等功能。其中写零指令主要针对的是特定的文件系统,而数据拷贝指令则是为了解决不必要的数据转移,如在访问网页或者在线交易应用中,数据频繁读取、写入,而很多数据可能更多的是从SSD的某个存储块转移到另一个存储块,数据拷贝指令则是为了避免这些数据重复,或许只需改变LBA-PBA的对应关系即可,而无需擦除、写入等操作。
多路访问则是为了解决多个主机同时对某个命名空间进行访问需要总线协调的问题。不管是数据拷贝指令还是多路访问,其都能达成快速响应的需求,同时因为避免了不必要的操作,可进一步降低SSD的能耗。如下图所示,仅是数据拷贝指令就可为SSD节省大量的能耗。
如上图所示,在加入了数据拷贝指令之后,避免了不必要读取写入操作,仅100ms时间就可节省1.8W的功耗。这个效应一大放大,其可进一步降低数据中心的能耗需求。
${PageNumber}擦除编码——新型可扩展的数据保护方式
云模式可以说是伴随海量数据难题而兴起的。海量数据难题不仅仅体现是在运算能力上面,也体现在存储方面。在存储方面,除了增加存储成本以及提高对存储性能的需求之外,还使得存储系统的数据安全瓶颈也开始凸显出来。
在之前的存储系统中,一般都采用RAID技术来对数据进行保护,一旦阵列中某块硬盘损坏,可通过RAID技术所形成的镜像来对丢失数据进行恢复。但随着海量数据问题的出现,RAID越来越难发挥其作用。
如采用2TB的硬盘作为存储介质,某块硬盘故障,使用镜像对其进行恢复,大概需要4个小时,而这还是将恢复作为最高优先级的情况下才能实现的数据恢复时间。但在实际情况中是不可能出现的,一般都是将RAID作为较低优先级的,在计算资源闲置的情况下在后台进行的,那么在这种情况下,RAID重建的时间就会不断延长,数据恢复长达1-2周也就不算奇怪了。如果在数据重建过程之中,又发生硬盘故障的话,那么也就意味着数据将永久丢失。因为RAID 5最多能允许阵列中一块硬盘损坏,RAID 6允许两块硬盘同时故障,但在海量数据时代,多块硬盘同时损坏并非不可能,企业重要资源之一的数据该如何保证其安全呢?
英特尔在IDF大会期间公布了新的可扩展的数据保护方式——擦除编码。其工作原理是将存储系统接收到的大块数据进行切割并编码,之后再对切割后的数据进行再次切割并编码,重复这一操作直到数据切割到满意的数据块大小为止,这样使得数据块分散成多个数据块,再进行冗余校验,将不重复的数据块和编码写入存储系统之中。其与传统的RAID数据保护如下图所示:
▲擦除编码将数据保护架构由RAID 5/6扩展至RAID k,k等于在不造成数据丢失的情况下,可以介绍的故障数量。对于RAID 5来说,k=1;对于RAID 6来说,k=2;对于擦除编码来说,k=n,如在16块硬盘组成的阵列之中,采用擦除编码机制的话,即使6块硬盘同时故障,其也可对丢失数据进行恢复
由此可以看出,擦除编码目前主要针对的大数据块,英特尔也将其应用在其所推荐的大型对象存储系统之中,经过实际测试,其结果显示,与传统的RAID相比,擦除编码在各个方面都具有无可比拟的优势,具体结果如下图所示:
擦除编码的应用还不仅与此,在关于擦除编码的技术课程之中,相关的技术工程师还介绍了擦除编码灵活应用于多个数据中心的情况,具体如下图所示:
结语
云不仅仅是一个概念,通过英特尔公司对云的理解以及其提出的云存储参考架构和技术细节,我们已经真真切切感受到云时代的来临。云已经不再是一个虚幻的概念,而真真正正地呈现在了我们的面前,英特尔云,让你看得见,摸得到,更能用得起!