第3章 Power服务器业务连续性方案介绍
IBM Power服务器业务连续性解决方案是从Power系统硬件、操作系统和Power 系统软件这三个技术层面实现的。利用按照大型机可用性理念设计的Power系统硬件的RAS特性以及Power服务器的动态分区迁移功能实现高可用。利用AIX操作系统的动态应用程序迁移功能最大限度减少计划内应用程序停顿,实现高可用。利用IBM Power HA和Power HA/XD系统软件,实现本地高可用集群以及远程容灾功能。
3.1 Power 系统硬件技术实现高可用
Power 服务器硬件所具备的RAS特性及PowerVM动态分区迁移功能,帮您实现高可用:
RAS(Reliability, Availability, Serviceability 高可靠性、高可用性、高可服务性)是最早用于IBM大型机的技术,IBM致力于使每一个新系列的系统比前一代更加可靠。这就使得今天Power系统变得如此可靠,以至于几乎没听说过有任何因为硬件问题导致的系统灾难。
PowerVM LPM (Live Partition Mobility动态分区迁移)功能实现了将一台POWER6服务器上的分区实时地迁移到另外一台POWER6服务器上。它允许您将正在运行的AIX和Linux分区,以及它们所承载的应用程序从一个物理服务器迁移到另一个物理服务器,而不会对基础服务产生任何影响。这项迁移操作只需要花费几秒钟的时间即可完成,可以维护整个系统事务的完整性。这项迁移操作将传输整个系统环境,包括处理器的状态、内存、附加的虚拟设备,以及连接的用户, 从而有助于实现连续、高可用性目标。
3.2 操作系统的技术实现高可用
首先介绍一个概念WPAR(Workload Partition工作负载分区)。WPAR是AIX6提供的一种全新的软件虚拟技术,用于隔离用户和应用程序。它不依赖于硬件特性,是多种AIX核心技术的综合体现。WPAR 是由软件创建的、AIX 6 映像中的虚拟化的操作系统环境。对于所承载的应用程序来说,每个工作负载分区都是一个安全的、隔离的环境。WPAR 中的应用程序认为,它正执行于自己的、专门的 AIX 实例中。对于大多数应用程序来说,WPAR 就好像是一个AIX 的启动实例。通常,在 WPAR 中,应用程序无需修改就可以运行。
动态应用程序迁移是 AIX 6.1 的一项独特创新,是其 WPAR 策略的组成部分,它允许您移动工作负载,而不是整个分区。实际的目标 WPAR 可以是不同的服务器,但并不一定必须是不同的服务器。它比较灵活,因为您可以在一些具备混合物理体系结构(Power5 和 Power6)的环境中使用它。它可以将应用程序从需要计划停机以便进行维护的系统中移动到别处。通过将工作负载从不堪重负的服务器移动到负载较轻的服务器,它还可以用于提高性能。而且,通过采用这种方式移动工作负载以允许物理服务器在非高峰期间进入睡眠状态,它还可以帮助节约电能。
下面的表格介绍了动态应用程序迁移和动态分区迁移之间的一些基本区别。
3.3 Power系统软件实现高可用
利用IBM PowerHA和Power HA/XD系统软件,可以实现本地高可用集群以及远程容灾功能,产品要点如下:
有助于保护关键业务应用,避免中断;无论是计划内还是计划外中断
在远程站点使用可选特性PowerHA™ /XD,将故障切换功能扩展到备份资源,支持GLVM异步模式或SAN Volume Controller(SVC)上的全局镜像
通过支持IPV6,允许客户访问您的PowerHA AIX集群,获得更高的安全性特性和合规性
3.3.1 IBM PowerHA for AIX (HACMP)
IBM PowerHA for AIX® (原名为High Availability Cluster Multiprocessing -HACMP™) 是用于IBM Power系列服务器上的高可靠集群软件,通过冗余配置,消除单点故障,保证整个系统连续可用性和安全可靠性。HACMP是利用网络来侦测主机及网卡的状况,搭配AIX所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作;若是主机故障则切换至备份机上继续应用系统的运行。PowerHA for AIX解决方案始终提供可靠的监控、故障检测和业务应用环境向备份资源的自动恢复,为核心数据业务弹性奠定基础。
下图所示为基于AIX LVM功能(软件免费)实现的交换磁盘集群(仅限本地),完全冗余,无切换时间,适合7x24环境。
下图所示为共享磁盘存储高可用集群:
您可以对PowerHA进行配置,以响应数百个系统事件,其中包括尚未严重到中断正常系统运行的问题(例如,流程故障或系统资源耗尽等)。PowerHA可以监控、检测和响应这些条件,从而保持在出现计划外软件问题时系统服务的可用性。在一个PowerHA集群中,最多可以参与32个运行AIX操作系统(OS)的节点,或者最多8个运行Linux® OS的节点,提供坚如磐石般的高可用环境
PowerHA在AIX环境中运行(也可以在IBM i环境中运行),并利用IBM PowerVM™ 虚拟化功能,动态增加系统资源,以支持割接工作负载和实时分区移动性。当在一个备份服务器上的小型微分区中运行时,该方案可以在系统资源中自动增加,从而在出现故障切换事件过程中支持主应用。当在一个实时分区移动性环境中运行时,PowerHA for AIX可以与自动迁移环境一起移动!在按计划进行维护时,通过将用户、应用和数据迁移到备份系统,PowerHA for AIX解决方案可以最大限度消除计划内中断。
PowerHA V5.4支持Linux,可以将其很多强大的功能和传统扩展到Linux 环境。对Linux支持将包括可用于AIX的可靠监控和故障检测基本功能。
3.3.2 PowerHA/XD for AIX (HACMP/XD)
通过PowerHA/XD可以实施容灾解决方案。PowerHA/XD(Extended Distance)是PowerHA for AIX的一个可选特性,可以提供GLVM(Geographic Logical Volume Manager)异步模式,并支持SVC Global Mirror。这两种选项都可以将应用切换到远程站点的备份资源, 而不会影响生产应用环境中的性能(考虑针对园区级距离专门优化的同步复制方法)。PowerHA/XD使用自身同步模式LVM AIX镜像技术, 通过与对于Enterprise Storage Server® (ESS)、IBM System Storage™(DS6000™ 和DS8000™)和SAN Volume Controller(SVC)Metro-Mirror对等机的园区级故障切换和对于IP连接对等机故障切换的透明集成,从而能够提供支持。 当PowerHA for AIX检测到一个故障时, 它可以在一个远程冗余系统上将其重新启动,从而能够快速、自动地采取措施,恢复该应用。
PowerHA/XD能够在镜像多个站点间的关键任务数据的同时,还能够将故障切换到这些远程站点,这种特性对于必须保护自己避免出现站点间故障或大规模灾难的客户来说,是至关重要的。这种特性可以应用到拥有多个站点、地区运营的任意规模的企业,或者希望分散管理数据的任意地点。PowerHA/XD提供多种技术,可以实现远距离数据镜像、故障切换和重新同步。
PowerHA/XD实现的容灾,可基于两种技术实现:Metro Mirror 和GLVM。
Metro Mirror(城域镜像):如图所示为带IBM DS8000的PowerHA/XD高可用性集群企业级解决方案,DS8000 提供Metro Mirror功能,数据通过FC网络进行复制。可以实现随需应变的服务器角色切换、离线磁带备份,最大限度地降低日常管理要求
GLVM:如图所示为PowerHA /XD for AIX地理分布式存储镜像集群,通过GLVM功能,基于IP网络实现数据复制:
3.3.3 Capacity BackUp 实现业务连续性
对于高端IBM Power™ 595服务器,可以使用一个专门配置和定价的Capacity BackUp系统实现远程站点安装。该服务器包括一个最少数量的活动处理器和大量非激活的随需应变(CoD)处理器,可以在需要进行灾难恢复时临时激活。一个PowerHA集群可以自动检测生产系统的缺失,从而能够激活Capacity BackUp系统,将客户关键应用切换到所需数量的CoD处理器中,保持业务的正常运行,并将服务损失降至最低。
3.3.4 PowerHA Smart Assists(智能助手)简化应用部署和配置
简化PowerHA在 DB2® 、Oracle和WebSphere® 环境中的实施与配置。通过部署特定应用的知识,扩展PowerHA标准自动恢复特性,Smart Assists产品包可提供所有必要的应用监控器和开始/停止脚本,简化整个配置流程。
PowerHA解决方案在IBM Power™ Systems上的AIX和Linux操作系统下运行。通过创新的技术、逻辑分区、开放标准对于应用灵活性的广泛支持、以及管理IT基础设施的全方位工具,这些服务器可以提供如今需求不断增长的业务环境所需的性能、可用性、可扩展性和基础设施管理。它们将IBM Power Architecture® 技术与受大型机启发的RAS(可靠性、可用性和可服务能力)特性与OS的收益相结合,用于有效管理关键任务应用。
3.4 IBM Power服务器业务连续性技术优势
IBM在方案、技术及支持服务方面也有着其他厂商无法比拟的优势:
Power Systems 具有一系列独有的RAS(可靠性、可用性和服务性)特性,关键部件动态隔离,FFDC (首次故障数据捕捉)、计算校验防护技术等等;
AIX 操作系统可靠性远高于竞争对手,POWER6 提供独有的 Live Partition Mobility 功能;
PowerHA 稳定可靠,提供业界最全面最强大的集群及容灾功能。
LVM技术是AIX操作系统中的缺省技术,只需要少量的实施费用。