【IT168 评论】超融合基础设施(HCI)能够使企业IT资源供应(包括存储)变得不那么复杂,这得益于它的扩展方式。当企业需要向应用程序交付更多的处理能力或存储容量,或需要支持更多的工作负载时,管理员可以直接添加更多服务器,为集群增加节点。每个节点都包含一定量的计算能力和存储容量,并且环境会根据需要自动扩展。
其中的挑战在于,超融合基础设施会牺牲效率来简化资源配置。大多数数据中心并不需要以相同的规格增加计算能力、存储性能和存储容量。在几乎每个HCI环境中,这些资源中都有一两个是不平衡的,这意味着可用的资源一般多于所需资源。计算密集型环境最终会有多余的存储容量,而要求存储容量的环境最终会有空闲CPU。
行业已经发现了第一代HCI产品的效率问题。今天,IT专业人员使用两种主要方法来提高下一代HCI环境在提供计算、网络和存储资源方面的效率。
方法1:节点更少,更强大
第一个方法是将功能更强大、容量更大的节点与可以利用它们的HCI软件集成在一起。第一代HCI往往会出于性能和可用性的原因而首选高节点数的集群,在这种情况下,使用更强大节点的HCI环境,可以使总节点数保持最少。尽管这些功能更强的单节点成本更高,但是一般会降低总支出,因为节点数更少,同时也只需要更少的网络基础架构和更简单的管理。在大多数情况下,6个以上功能更强的节点的群集可以胜过16节点的更弱硬件群集。
这些更强大的节点可以像第一代HCI一样横向扩展,并且也可以纵向扩展以确保每个节点在添加另一个节点之前都能充分利用。IT管理者可以以最少的配置购买节点,并根据需要增加计算能力和存储容量。这些节点的内部扩展意味着HCI软件的存储组件还必须以不同的方式实现资源管理和数据保护,因为每个节点可能具有不同的配置。
当节点配置了全NVMe闪存和高内核数CPU时,这种设计下的节点负载能力最好,因为这样每个节点可以支持几十个虚拟机,并可能交付数百万个IOPS。由于具有高基线性能,HCI集群可以同时支持各种工作负载,并使组织能够对以前只考虑裸机的工作负载实现虚拟化。
HCI软件还需要充分利用所有NVMe 闪存环境,将数据直接提供给每个节点上运行的虚拟机(VM)。使用NVMe时,任何需要网络访问数据的I/O都可能会抵消掉NVMe的很多性能优势。甚至数据保护策略也必须优化。HCI供应商需要重新考虑HCI集群中的典型的擦除编码技术,数据保护应该利用更简单的复制技术,更高级的擦除编码或HCI软件应该从超聚合集群中卸载。
与第一代HCI相比,功能更强大的节点策略提供了更简单的资源配置,因为需要管理的节点更少,而且可以在环境中运行更多的工作负载。它甚至有可能成为整个数据中心的单一环境,在同一接口下统一所有供应任务。
这种提供计算和存储的策略还提高了效率,通过向HCI的基本横向扩展技术增加纵向扩展能力。在添加额外的节点,可以通过向每个节点添加额外的计算和容量进行扩展。这种方法不仅更有效,而且可以平滑购买曲线。
从成本效率的角度来看,使用更强大节点的方法不仅通过需要更少的服务器来降低总的硬件获取成本,而且还提高了授权效率,因为大多数HCI供应商都是根据节点和内核的数量来授权软件的。虽然这一方法会访问大量的内核,但是由于使用了NVMe,就能够用更少的内核做更多的事情。最后,由于节点的减少,网络基础设施的需求也降低了。因此,组织需要购买交换机和网络接口卡就更少,从而进一步降低成本。
方法2:混合超融合基础设施
HCI被认为比其他数据中心基础设施方法更简单的一个原因是它将计算、存储和网络整合到一个单层中。整合的一个优点是,HCI软件可以确保与虚拟机相关的数据直接存储在虚拟机运行的节点上。这种对数据的直接访问消除了网络对存储I/O性能的影响,但它确实限制了HCI供应商在调用分层策略之前每个节点可以存储的数据量。分层或缓存在HCI环境中是有问题的,因为它必须跨节点集群进行,这会增加所有I/O的网络流量,并危及存储性能。混合工作负载的能力也处于危险之中,因为要求容量的工作负载可能会迫使HCI分层或缓存软件卸载存储密集型工作负载所需的数据。
第一代超融合的一个替代方案是采用一种更混合的存储资源配置方法,将共享存储与HCI结合使用。其中的挑战在于如何使用共享存储,在不会重新将复杂性引入到流程中的前提下。在混合模式中,所有节点都使用共享存储池来卸载旧的数据,因此每个节点中的内部非池化存储专用于该节点上的VM。如果非池化层是NVMe闪存驱动器,那么这些VM的存储I/O将非常高。
共享存储池使商品节点的规格变小,其配置主要关注于将计算能力交付给它们所支持的VM。在这种体系结构中,HCI软件将所有新的或修改的数据存储在I/O发生的节点中,然后将其复制到共享存储区域。所有的数据保护,比如RAID或擦除编码,都是在共享存储区域执行的,这就减轻了节点分配数据保护所需的计算开销,使计算能力更加关注VM性能。
当VM请求较旧的非缓存数据时,节点只需要访问共享存储区域,因此共享存储区域的性能不高,这进一步降低了成本。共享存储区域通常可使用:全闪存,用于缓存丢失的潜在性能下降可能影响VM环境的情况;也可使用HDD,用于缓存丢失的影响可以忽略不计的情况。
这种混合方法使HCI资源供应比第一代HCI更有效。IT人员只在需要响应更多计算能力需求时(通常是由于新应用程序)向集群添加节点。当它必须响应更多容量的请求时,提供更多存储只需要扩展单个共享存储区域。最好的结果应该是负载运行在具有非常高的CPU利用率水平的节点上,而不会产生过多的存储容量。
由于大多数HCI扩展是为了增加容量而不是计算能力,所以大多数数据中心会发现混合HCI往往需要更少的节点。
在更强节点和混合模式之间进行选择
当比较这两个方法时,与第一代HCI相比,它们都极大地提高了计算和存储供应效率。更强节点概念可以与现有的管理程序和HCI软件协同工作,但是需要定制的、专门构建的节点。另外一方面,混合模型可以与更传统的现成服务器硬件一起工作,但是需要对管理程序软件进行一些定制。从本质上讲,混合供应商会将他们提供的存储软件组件替换为一个更智能的组件,该组件从节点卸载非活动数据并实现数据保护。
这两种资源供应方法的目标都是减少总体节点数,并提供改进的存储I/O性能,从而降低总体基础设施成本。每个方法还应该能够支持多种工作负载。混合模式为更多节点的集群带来了效率,而更强节点消除了集群扩展的大部分需求,IT部门需要根据自身业务规模进行确定。
原文作者:George Crump