【IT168 专稿】服务器虚拟化最大的风险是“把所有鸡蛋放在同一个篮子里”,一旦服务器发生故障就可能导致大规模服务中断,在规划Hyper-V项目时,一定要将系统可用性及服务连续性纳入首要考虑因素。
相关统计数据显示,服务器整合是企业部署虚拟化的主要原因,虽然服务器整合帮助用户提升了资源利用率,同时获得了节能及集中管理等种种优势,但是也带来了极大的风险。在物理环境中,出于对稳定性和安全性的考虑,一台服务器通常只执行一个应用程序,一旦服务器发生故障,只会影响这个应用程序所提供的服务;虚拟化之后,多台应用服务器以虚拟机的形式集中在一台物理服务器上运行,虽然彼此独立,但就像“把所有鸡蛋放在同一个篮子里”,一旦发生硬件故障,所有虚拟机都会停止运行,换句话说,一台服务器故障就可能造成大规模的服务瘫痪。
服务器虚拟化厂商都很清楚虚拟化之后的风险,纷纷将缩短停机时间、确保服务器连续性的高可用性视为重点,例如VMware Virtual Infrastructure 3的HA,以及Virtual Iron V4 XEE的LiveRecovery,微软的Hyper-V当然也不例外,比较特別的是,Hyper-V的高可用性功能可与Windows Server 2008操作系统内置的故障转移集群(Failover Cluster)功能整合,在服务器发生故障时将服务迅速切换至另一台正常运行的服务器,将意外导致的非计划停机时间降到最低。
相比于其他服务器虚拟化技术提供的高可用性,Windows Server 2008 Hyper-V的故障转移集群具备以下优势:
1. 是Windows Server 2008 Enterprise/Datacenter版本的标准功能,Hyper-V被视为集群支持的服务,不需另外购买授权
2. 最多可支持16个节点,测试时可手动指定转移的节点,当灾难发生时,集群系统会自动寻找并移转至有足够内存容量的节点
3. 相比于Windows Server 2003以前的MSCS(Microsoft Cluster Service),Failover Cluster大幅简化了设置管理步骤,新手也能很快熟悉如何操作
Hyper-V故障转移集群的架构
在实际部署Hyper-V故障转移集群之前,首先要了解故障转移集群的架构。基本的故障转移集群的组件必需包含两台物理服务器、一台共享存储设备以及SAN环境,此架构称为2-node failover cluster(如下图0)。物理服务器必须完全兼容Windows Server 2008的64位处理器,而且强烈建议两台型号、规格完全相同的服务器。共享存储设备一般指的是FC或iSCSI介面的磁盘阵列,不过这类设备通常价格不便宜,功能与扩展性也有一定限制。近年兴起的一种称之为存储服务器(Storage Server)的共享存储设备,将行业标准服务器和存储虚拟化软件完全集成,由于其功能完整、价格合理,而且具备高扩展能力,成为不少企业构建虚拟环境存储系统的首选。
以飞康 NSS(FalconStor Network Storage Server)为例,它结合了4核、双处理器的x64服务器强大的运算能力,以及大容量、低成本的SATA、SAS硬盘作为存储资源,提供与中高级磁盘阵列相同、甚至更高的I/O性能。此外,中高级磁盘阵列具备的快照、镜像、自动精简配置(Thin Provisioning)等高级功能,飞康NSS也都一应俱全,还可以通过远程复制功能,将本地的故障转移集群延伸到远程的灾备机房,成为多重站台集群(Multi-site Cluster),也就是Hyper-V的异地灾备。