【IT168 技术】数据就是资产。在计算机应用十分普及的今天,保障数据的安全性已经深入人心,系统和数据的安全性尤为重要,对系统和数据的高可用性和高安全性有着更迫切的需求,因此,如何在现有网络环境的基础上,设计构造一套合理高效的网络应急计划方案,是各行业面临和必须解决的一项重要任务。中科存储整合"金存"系列磁盘阵列,推出了基于Cluster集群技术的双机备援解决方案。该方案基于Cluster集群技术,通过软硬件系统的紧密结合,为用户提供了强大的容错功能,在国内金融行业的关键业务系统中有着广泛的应用,经过长期的实践检验证明中科存储Cluster双机容错系统是一种性能优越的容错解决方案。
一、系统构成
中科存储Cluster双机容错系统基于Cluster集群技术,主要由共享外部存储器的硬件设备--"金存"磁盘阵列系统和Raidsys或Legato Octopus双机容错软件组成。
在硬件组成上,中科存储Cluster双机容错系统除了两台服务器外,主要包括金存磁盘阵列柜及服务器上的SCSI卡和网卡(NIC),其中金存系列磁盘阵列系统是一个独立于主机的RAID系统,目前主流的服务器和操作系统都可与之无缝连接。同时利用金存磁盘阵列产品独特的内部容错设计,可大大加强整个系统的可靠性,而且产品本身几乎无须维护,因此不仅非常适合金融、证券、邮电、保险、航空等行业应用,而且还适合于多媒体视讯系统、软件开发或VOD用户,具有先进的技术特色、优越的性能、高可伸缩性及易用性。
(金存磁盘阵列系统-用于企业级网络的高可用性RAID存储系统)
在软件组成上,中科存储双机容错系统根据用户不同的需求,提供Raidsys 和Legato两种专用双机软件可供用户选择。通过安装在两个服务器中的双机热备份系统软件,整个系统具有双机相互备援(Dual Active)和在线守候(Hot Standby)两种模式的在线容错能力,用户可根据需要选择不同的软件,保证用户数据的完整一致性及用户业务的高可靠性,实现数据的永不丢失和系统永不停机(Non-stop)。
其中Legato Octopus是针对Windows NT平台的数据备份和数据可用性方案,它是一种低冲突的实时数据保护方案,对数据的备份与应用切换结合得尤其出色,提供了在无需手工操作或服务器重启的情况下,能把一个彻底失效的服务器的功能恢复正常的自动恢复数据功能,可为数据提供最大限度的保护,具有操作简单、使用灵活、切换自动、透明等特点,用户可以得到最大的灵活性,切实保护所有数据。
而Raidsys HA 是一套提供防止主机因意外当机造成长时间停机的高可靠性软件(High Availability),它采用浏览器界面与 GUI 图形使用者界面,具有操作界面友好、维护方便和支持多平台、多对象功能等强大特点,能以最低成本向用户提供近乎不停顿的计算机运行环境。当一部工作主机(active server)当机或无法使用时, Raidsys HA 将自动侦测出故障并激活备援服务器(backup server)内预先设定的程序进行接替(take over)工作,从而保证信息系统能不间断地运行。
二、系统的整合
中科存储Cluster双机容错系统不是简单的硬件和软件的叠加,而是中科存储根据用户需求,在Cluster集群技术的基础上,全面整合软硬件技术,实现中科存储金存磁盘阵列与Raidsys/Legato容错软件有机结合的成熟方案。
整个系统的组合架构工作包括三个方面:
1、硬件系统的连接
2、容错软件的安装和配置
3、与用户应用的整合
在硬件系统的连接方面,主要包括中科存储磁盘阵列与主机的连接和侦测网络的连接。中科存储的磁盘阵列中提供两条标准68Pin外接SCSI电缆,可与任何服务器的Wide Ultra IVD SCSI接口接驳,用户不需要在服务器上增加任何硬件设备或驱动程序,就可以将支持双主机的磁盘阵列系统分别连接至两台服务器的SCSI接口,实现硬件系统的连接。
磁盘阵列连接至主机后,用户可以象增加普通硬盘那样对其进行分区、格式化、安装文件系统等操作,同时中中科存储Cluster双机容错系统还在NT平台上架设了侦测网络,可使用RS232线路、TCP/IP和共享网络三种侦测方式,在阵列柜中的逻辑盘上划分用于交换主机心跳的5MB设备分区,保证了用于侦测网络心跳的TCP/IP线路的通畅。三种侦测方式可同时使用,互为备份,大大提高了双机系统的可靠性。
与用户应用系统的整合方面,中科存储Cluster双机容错系统提供了具有全面容错能力的应用系统平台。它既可以同所有大型数据库配合使用,也可应用于用户自主开发的应用软件。在与容错系统整合时,只需将数据库系统分别在两台服务器上安装,并将数据文件放置于共享的磁盘阵列即可,而不需要对应用程序进行任何更改。
三、系统功能特点
由于中科存储Cluster双机容错系统建立于Cluster集群技术之上,将一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理,不仅简化了用户操作和管理,更为客户应用系统提供了高可靠的服务,当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管,由于风险分散到两台主机上,整个系统具有99.99%的高可靠性。
基于Cluster集群技术的中科存储双机容错系统解决方案能够管理两台服务器,并提供Hot Standby双机热备份和Daul Active即双机互备援两种基本工作模式,当任何一台处于工作状态的服务器无法正常工作时,通过双机系统容错软件,使处于守候监护状态的另一台服务器都能迅速接管不正常服务器上的业务程序及数据资料,使得网络用户的业务交易正常运行,保证交易数据的完整一致性及交易业务的高可用性。
在硬件性能上,中科存储Cluster双机容错系统具备全面的RAID功能,能支持多个RAID级别(0、1、3、5、0+1、10、30、50、JBOD NRAID),具有全面的RAID功能;系统通过扩充能提供4到8组SCSI通道和8到20个热插拔硬盘槽位,不需停机即可增加硬盘数量,可扩容磁盘卷大小,具有极大的可扩展性;通过独有的EMC环境控制器,能够精确的监视子系统的内部环境并能够自动的检测和管理失效磁盘驱动器;同时,通过简化安装步骤、减少中间部件、缩短安装时间,提供了更好的稳定性及可靠性。
同时,中科存储Cluster双机容错系统在金存磁盘阵列产品高可靠、高可用性的基础上,结合Raidsys或Legato Octopus监控软件易于管理、方便维护的特点,并通过良好的软硬件整合优化,可以有效地提高主机工作效率,减轻服务器和网络设备压力,保证系统稳定性。更为重要的是,利用容错软件与磁盘阵列软硬件相结合的解决方案,不仅达到监控所有的软硬件的资源操作,具有自动处理错误的功能,而且改变了传统单一硬件容错方案中的一些缺点,例如:投资规模较大,设备容易损坏。软件容错方案虽然比硬件方案更灵活,投资相对小,但占用系统开销大的状况;充分整合硬件方案和软件方案的优点,具有运行效率高、投入少和管理灵活的特点,成为企业架构双机容错系统的首选解决方案。