存储 频道

中标普华高可用性集群系统解决方案

【IT168 资讯】

  1. 设计目标   

  中标普华高可用性集群系统运行于两个或多个节点上。目的是在系统出现某些故障的情况下,仍能继续对外提供服务,最大限度地减少服务中断时间,用以提高系统可靠性、可用性、适用性(reliability、vailability、serviceability ,即RAS)。   

  中标普华高可用性集群系统结构图:

  系统结构图是典型的HA解决方案系统结构:系统由主机A及备份机B组成,主、备机系统上都运行中标普华高可用性集群软件,二者之间通过一根心跳线相连(可以通过串口或以太网口),共享一个磁盘阵列。由主机A对外提供服务,备机B则通过心跳线来监测主机A,一旦主机A出现故障(如电源失效、主要部件失效、启动盘失效等导致系统发生故障),备机B可以把主机上的所有资源接管过来,从而继续对外提供服务。  

  主机和备机是相对而言的,也就是说两者可以各自负责某些服务及应用,两者可以互为备份,即active/active模式。这样,既可以提高系统的可靠性、冗余度,又可以充分利用硬件资源。   

  中标普华高可用性集群系统具有系统崩溃的智能检测与处理系统,可以利用各种手段来检测硬件、存储设备、网络的故障,并提供对各种资源(包括IP、存储设备、文件系统、多种服务及应用)的接管。   

  2. 功能   

  多种冗余模式   

  中标普华高可用服务器系统提供了多种冗余模式,   

  双机在线待机模式   

  在这种模式下,一个服务器作为主服务器。正常情况下其承担所有的服务。另外一台 服务器作为待机服务器,正常情况下除了监控主服务器的状态,不进行其他的操作。一旦主服务器宕机,待机服务器就接手工作,成为新的主服务器。客户仍然可以拥有同样的服务器IP地址、NFS、数据、数据库及其他……这种应用模式近似于上面介绍的典型应用模式—A与B。实际上是在完成同一个功能应用,安装在主机上的HA软件通过心跳线来实时监测对方的运行状态,一旦正在工作的主机A因为各种硬件故障导致系统发生故障,主机B立即投入工作。   

  双机就绪模式   

  在这种模式下,两个主机都作为主服务器,共享自己的磁盘阵列,各自承担一部分服务。例如服务器A在执行应用A, 服务器B在执行应用B, 两个主机在正常情况下各自独立运行自己的应用,两个主机同时又都作为对方的待机服务器,通过心跳线监控对方的状态。一旦某一服务器宕机,另一台服务器就承担所有的服务,为所有的客户服务。即一旦服务器A发生故障,服务器B马上接管服务器A上原来的应用;或者服务器B发生故障,服务器A马上接管服务器B上原来的应用,这是一种互为冗余的模式。   

  三主机模式  

  在这种模式中,待机服务器C同时监控主服务器A与B的状态。一旦服务器A或B宕机,服务器C将承担其服务,为客户服务。这种系统结构既保证了系统的安全运行,又保证了系统资源合理利用。

  多种资源接管 

  提供了对各种备份资源的接管,如网络IP地址、SCSI存储设备、RAID存储设备、文件系统、NFS、数据库及各种服务、应用、系统进程。

  多种心跳方式

中标普华高可用性集群系统中,主、备机之间由心跳线相连接,通过心跳服务来监测对方运行状况。心跳线可以通过串口或以太网口连接来建立。

  心跳频率的设定

管理员可以方便地对心跳频率进行设定,根据实际情况决定心跳服务的检测周期。  

  “死亡”时限   

  由于某些系统故障可能是暂时的,我们并不希望马上将其资源接管到备机上。我们可以设定一个时间限制,超过该时限,主机仍处于故障之中未能恢复,则认为主机“死亡”,开始资源的接管工作。

  完整的日志

中标普华高可用性集群系统对心跳服务的启动、停止,对各种备份资源的接管过程都有完整的日志及相关调试信息,便于系统管理员进行监控、管理。

  系统自检

中标普华高可用性集群系统提供基于软件的watchdog 定时器来进行系统自检。如果本地机意外停止心跳超过一分钟,则系统自启,以便恢复。

  数据镜像支持

中标普华高可用服务器提供镜像服务支持,如果您没有公共存储(盘柜),可以应用我们提供的数据镜像模块,保证数据的一致性。通过网络完成存储块设备的镜像,从而实现两主机文件系统的实时同步,达到数据备份的目的。

  3. 中标普华高可用性集群系统服务内容

中标普华高可用性集群系统可以满足各个行业对计算机系统高可靠性的要求,如网络系统的可靠性、网络服务的可靠性、共享RAID的可靠性、共享文件系统的可靠性、进程的可靠性、数据库可靠性等。

0
相关文章