存储 频道

浪潮整机柜存储资源池化方案的现实意义

  【IT168 资讯】近年来,房价飞涨,而作为房屋基础的地价也不断走高,因此越来越多的住宅、仓储、工厂向地价更为低廉的郊区迁移。但是高档的写字楼、商场仍在CBD林立,这是为何?

  这是因为不同的行业对于地价的敏感性和承受度不同。假如你开了一家大型广告公司,服务着多家世界五百强客户,在日常工作中需要进行大量的市场调研和信息交换,那么你可能会选择把公司总部设置在城市的CBD。虽然地价昂贵,但是方便与周边的客户进行联系,也便于信息的收集和处理,这都是昂贵地价带来的价值。

  但是如果你开设了一家大型仓储公司,那么公司所在地的选择或许更适合在临近交通枢纽的郊区,这既方便货物的运输,又拥有较低的成本。

  如何合理利用宝贵的主板“土地”?

  在服务器设计中会遇到同样的问题。每块主板都类似一个微型的城市,其中CPU所在的位置就相当于市中心,电路和线缆就是道路,而存储设备就是存储数据的“仓库”,如何更合理的利用主板上的空间,将不同“地价”的土地分配给不同的部件,是控制IT硬件系统成本的关键。

  在主板上,越靠近CPU的位置就能获得更高速、低延迟的I/O连接,而离CPU越远的空间,物理空间的价值就越低。因此在服务器的设计中,CPU的周边位置首先会是内存插槽,然后是各种PCIE插槽。由于在通常情况下,数据存储所需要的传输速率远小于内存和各种基于PCIE的计算类部件,所以硬盘处于主板的最外围,或者是通过线缆的形式远离CPU。那么,为了将主板的“土地”价值发挥到极致,我们是不是能够在计算型服务器中不放置硬盘,将空间都留给CPU、内存和其他关键计算部件,而将硬盘全部“搬迁”至更远的远郊、甚至其他的“城市”(服务器)?

  这种方案是可行的,也是很有必要的。今年9月,浪潮发布整机柜服务器SR4.5,其中就包括了业界首发的整机柜存储资源池化解决方案,将服务器的计算和存储资源完全解耦,计算类节点只需要CPU、内存等计算类部件,存储节点只需要硬盘和相应接口,并通过SAS Switch节点将计算节点与存储节点相连。这样,CPU的周边都留给了内存和其他协处理部件,硬盘则在另外的服务器节点中组建成一个大的资源池,主板上的“土地”得以运用到极致。

  浪潮整机柜存储资源池化方案示意

  虽然从理论上说,整机柜存储资源池化方案是更优的数据存储硬件系统架构。但是也许会有用户还有些疑问,采用如此创新的架构,适合我的业务应用么?会不会给运维带来新的困扰?看看下面这些问题,提出这样疑问的客户或许会有全新的认识。

  整机柜存储池?我有那么多的数据存储么?

  首先,来看下浪潮整机柜存储池化方案能够存储多少数据。如果不考虑数据传输的带宽瓶颈问题,42U整机柜可以放置1个计算节点+1个SAS Switch节点+30个JBOD节点(1U支持20块硬盘),按照每块硬盘8T的容量来算,单个整机柜最多可以存储4.8PB的数据。

  JBOD节点,1U空间支持20块硬盘

  但这是极限的容量,在实际上线应用中会受到硬盘带宽和单机柜供电的影响和制约。经过综合考虑和实际测试,浪潮认为每个计算节点挂接60块硬盘是存储应用的非常好的方案:在保证数据传输带宽不成为性能瓶颈的前提下,将存储资源池做到最大。针对供电问题,在不进行机房供电改造的情况下,半柜的配置,即4个计算节点+1个SAS Switch+12个JBOD节点配比的用电量约为3000W,满足大多数传统数据中心的供电要求。

  也就是说,如果你的数据中心拥有1.92PB左右(按照8T硬盘,12个JBOD来算)的数据,就适合采用浪潮整机柜存储资源池化方案,只需要半个机柜的容量即可存储PB级海量存储。

  我的业务类型很多、很杂,一套系统就能满足?

  通常,在公司初创时期,机房会选用更多的机架服务器,由于可以实现计算、存储、网络资源配比的均衡和通用性,机架服务器能够很好的适应多种应用类型。但是,随着公司业务规模和数量的大增,传统机架式服务器在应对大规模业务模型时,会逐渐显露出其弊端。比如,在处理计算密集型应用时,硬盘、PCIe扩展都被闲置浪费;在进行存储密集型应用时,CPU 和内存的设计配置就显得太高,负载常年较低,浪费大量计算资源的采购和运行成本。

  以前,解决这些问题的方案是定制不同型号的服务器,这样便解决了硬件资源与上层应用的匹配问题。但这也带来了新的问题,比如有些大型互联网公司的服役机型超过百种,每年新采购机型超过数十种。服务类型的增加,不仅给服务器的资源管理带来了困难,也给服务器的运营增加了很多困难和成本。

  这种情况下,采用浪潮整机柜存储资源池化解决方案便是很好的办法,通过SAS Switch将计算节点和存储节点解耦,并能够实现“硬盘级(分配最小颗粒度可以达到1块硬盘)”的CPU/HDD配比,通过一套整机柜存储资源池化解决方案,就能够组建成偏计算型或者热、温、冷不同热度存储的服务器系统。在单机柜内打破冷、热数据的限制,根据业务发展、用户规模、使用习惯动态的调整冷热分布,在大规模业务集群中实现计算、存储资源的灵活扩容或减少,避免了资源的不足和过剩问题。

  我的业务峰值波动大、生命周期短,系统会不会使用率不高?

  由于浪潮整机柜存储资源池化解决方案实际上组建了一个硬盘的池,在同一整机柜中的所有计算节点都能访问到所有存储资源,这也为动态业务的弹性迁移和保护提供了基础。

  以Hadoop大数据分析应用为例。在该例子中,初始配置了10台服务器和20个数据盘。每个服务器上分配了2个HDFS数据盘。通过机群管理系统对系统的运行状态进行性能评测和监控,这包括了动态测量每台服务器的CPU使用效率,IOPS,带宽等,并且对每个盘的IOPS和带宽也进行检测。动态检测的结果发现Hadoop节点上CPU的使用效率只有18%。管理调度层(通过人工干预或自动调度的策略)决定对该Hadoop机群进行资源的重新配置,把计算服务器结点减少到2个,并把原有的20个HDFS数据盘重新分配到剩余的2个服务器上,每个服务器接管10个HDFS数据盘。新的资源配置通过管理接口配置到SAS Switch上。新配置可在Hadoop业务在线的情况下完成,被释放的8个空闲CPU可重新分配给机群上的其他业务使用,而剩余的2个CPU在重新配置完成后继续执行原有的Hadoop计算业务。重新配置后剩余的CPU可基本达到接近100%的利用效率。

  浪潮整机柜存储资源池化方案资源配置界面

  业务变动给数据中心带来的另一个困扰是频繁的服务器改配。在使用传统机架服务器时,如果一个业务的服务器需求下降后,多余的服务器将会给到其他业务部门,但是由于性能需求不同,需要进行服务器硬件的改配。几台、十几台的改配尚可接受,但如果是双十一或者类似的突发服务器需求过后,可能是数百甚至数千台服务器的改配任务,这将耗费大量的人力物力。浪潮整机柜存储资源池化解决方案的优势在这种情况下又有了凸显,通过SAS Switch自带的管理界面,调整计算节点挂接的JBOD或者硬盘数量即可实现快速的配置变更。

  我通过软件实现了资源虚拟化,与这个方案有何不同?

  目前,通过软件定义可以实现数据中心资源的池化,比如公有云提供的云主机服务就是这一技术的实践应用。浪潮整机柜存储资源池化解决方案与软件的资源虚拟化并不冲突。软件虚拟化实现更大维度(多机柜,甚至整个数据中心)的管理,而浪潮整机柜存储资源池化解决方案主要解决单机柜或者更小维度的灵活调配。通过SAS Switch配置后的整机柜仍能被虚拟化管理,但却能实现更多软件虚拟化不能实现的便捷功能。

  在公有云,VDI等许多应用场景,需要支持在同一个机群硬件设施上支持多个虚拟主机,而出于数据安全的考虑,许多客户要求服务提供方保证他们的私有数据和其他访客的数据在物理上隔离(即存放在物理隔离的盘上,物理上保障其他用户的虚拟机不可能访问到他们的私有数据)。浪潮整机柜存储资源池化解决方案实现的就是单独的硬盘分配给不同的计算节点,也就保证了访客数据的物理隔离。

  腾讯实测31%的TCO提升,你要不要试试?

  通过浪潮整机柜存储资源池化解决方案的应用,腾讯分布式存储系统的CPU/硬盘比可达到1:60,相比原先的1:12比例提升5倍。通过上层存储软件,优化写队列并强化读性能,最大限度的发挥出整个架构的性能,极大提升服务器的能效比,降低整个服务器集群的TCO。

  以3.92PB的存储容量需求为例,需要使用40台传统机架服务器(单盘8T,2U12盘位)才可满足,全部容纳则要2个机柜,系统总功耗约为6KW。我们先假设这套系统的TCO(包括设备采购成本、机柜位成本、用电成本等)为1。如果使用浪潮整机柜存储资源池化方案,达到同样的存储容量,仅需要24台JBOD通过SAS Switch与8台1U2计算节点相连便可满足。由于浪潮整机柜服务器SR节点均为1U高度,因此1个整机柜既可容纳整套系统。计算节点的减少同时带来采购成本和功耗的降低(采用该方案后总功耗为5KW),整体来看TCO相比传统方案降低31%。

  目前,浪潮整机柜服务器SR4.5已经在百度、腾讯等大型互联网企业取得落地应用,同时浪潮整机柜服务器SR 4.5还能应对传统行业客户的分布式文件系统、Hadoop、超融合及冷存储等应用诉求,为企业打造绿色高效数据中心奠定IT架构基础。

0
相关文章