【IT168 资讯】部署灾备解决方案,是企业IT系统防范灾难、避免数据资产丢失带来严重损失的重要一环。基于浪潮云海OS核心组件服务器虚拟化系统InCloud Sphere的浪潮云容灾解决方案,致力于为企业IT系统建设集约、灵活、高效的灾备系统,构建安全可靠的云容灾平台。
两大故障发生场景
云环境下,由于企业业务种类的渗透和应用领域的扩展对平台的可靠性提出了极高的要求,越来越多的核心业务要求做到零恢复系统故障时间目标(RTO)、零恢复业务原点数据目标(RPO)。云数据中心下的故障场景包括单点和多点故障两类,系统容灾能力级别直接决定了灾难场景发生后,系统恢复的速度和恢复的程度,直接体现在用户业务中断时间和业务数据丢失数量上。
1)存储系统单点故障场景:主要是站点中的某一存储系统自身发生不可自愈的故障,单存储系统故障无需执行站点整体恢复。在容灾能力设计时,如果用户只要求该种灾难场景,则只需要考虑存储数据在不同存储设备之间的同步方法。在选择对应该故障的容灾方案时,可以根据对RPO的要求,选择合适的存储同步方法,来实现存储灾备、存储双活等容灾建设方案。
2)多站点整体故障场景:指站点遭遇到某种不可恢复的灾难,整体故障无法继续运行。站点整体故障场景需要对整站点进行恢复,因此同步云平台管理数据和虚拟机存储数据是场景设计的关键,可根据系统实际RPO与RTO需求,选择不同的云平台管理数据与虚拟机存储数据同步方法,来实现双站点容灾、站点双活、两地三中心等容灾建设方案。
数据同步,是设计云数据灾备的关键
基于虚拟化技术的云灾备解决方案的核心思想是双向复制,数据在其它地方同时产生一份可用的副本,此副本不需要做数据恢复,即可投入使用,当中断恢复后再还原回去。其中,实现虚拟化平台管理数据与虚拟机存储数据同步是容灾方案设计的核心关注点。
虚拟化平台管理数据同步方案,主要包含管理数据保存到存储设备进行同步、管理数据通过中间平台进行同步。虚拟机存储数据同步方案主要包括存储数据LUN复制同步、存储数据双活存储同步、存储数据硬件双活网关同步、存储数据软件双活网关同步。
根据不同的管理数据与虚拟机数据同步方案的特点,可根据用户实际需求,对其进行组合实现不同的云平台容灾方案,形成云平台不同等级的云平台灾备能力。
三种容灾方式,浪潮云海OS InCloud Sphere保障云端有备无患
浪潮云海OS InCloud Sphere虚拟化平台能够支持并实现LUN存储,双活存储,双活网管三种业界容灾方式,实现业界广泛的容灾。其下InCloud Sphere SRM容灾管理组件,可以实现保护本地站点所有iNode主机、存储遭到灾难性破坏,无法恢复时,可在备用站点进行重建,从而最大限度地减少对应用程序或用户造成的停机时间。
针对单站点存储容灾,浪潮InCloudSphere提供单站点LUN复制存储容灾方案、单站点存储双活容灾方案。
单站点LUN复制存储容灾方案主要由浪潮InCloudSphere SRM控制存储进行定期LUN同步操作,管理员可指定不同虚拟机执行该操作,整个容灾设置与相关操作完全在InCloud Sphere SRM端执行,无需另登录节点手工输入命令行进行设置,维护更加便捷。
站点存储系统在突发灾难场景后,管理员可通过InCloudSphere SRM执行灾备存储挂载工作,同时控制icenter刷新存储挂载点,实现站点内存储容灾恢复。
单站点单存储双活容灾方案方案对于单站点LUN复制存储容灾方案来说,系统的RPO时间大大降低,因为LUN复制并不能频繁执行,因此主备存储之间有一定的数据差异,该方案配合浪潮AS5600存储双活,形成组合方案完美解决了这个问题,在双活存储之间,虚拟机存储数据是实时同步的,因此系统恢复后完全保持了灾难发生时的状态,实现单站点灾难恢复。
单站点在存储故障发生后,管理员控制InCloudSphere SRM执行主备存储系统切换工作,同时控制AS5600断开双活设置,将灾备存储添加到主机节点,iCenter配合修改虚拟机挂载存储点管理数据,成功实现存储故障场景下灾难恢复。
针对多站点容灾需求,浪潮InCloudSphere提供了多站点LUN复制容灾方案、多站点存储双活容灾方案、多站点双活网关容灾方案。
浪潮InCloud Sphere提供了基于多站点LUN复制容灾方案,该方案无需额外设备即可支持双站点互为灾备站点的部署结构,在绝对满足可靠性需求的同时,可以极大节约了投资建设成本。
方案支持双站点最大距离为100KM的互为灾备部署,通过InCloud Sphere SRM容灾管理组件可提供容灾演练、计划性迁移、灾难恢复等能力,该组件支持以虚拟机为粒度的容灾对象选择,时可实现对容灾存储的配置管理,控制其执行定期LUN同步,容灾恢复后自动切换主备站点,统一管理InCloudSphere容灾的整个生命周期。在灾难恢复过程中,InCloudSphere SRM通过批量启动占位虚拟机,可实现零RTO的容灾处理。
浪潮InCloud Sphere同时提供基于浪潮AS5600双活存储的多站点存储双活容灾方案,通过浪潮AS5600双活存储间数据自行同步,实现虚拟机存储数据实时同步。同时,InCloud Sphere SRM控制双站点实现管理数据同步功能,用户可登陆InCloud Sphere SRM设置容灾范围,选择执行容灾演练等实际场景操作。
多站点存储双活容灾方案因其具有数据事实一致性的特点,可实现用户应用数据无丢失,做到RPO时间为零。在故障恢复时,SRM在容灾站点创建占位虚拟机也可以在短时间内完成,控制占位虚拟机启动后,即可实现整体站点成功容灾,所以整体RTO时间也非常短,对于重要的业务,可以设置启动优先级,真正做到RTO时间为零。
浪潮InCloud Sphere同时提供基于多站点网关双活容灾方案,该方案通过双活硬件网关实现主备站点指定LUN之间的读写同步,在不依赖特定双活存储的情况下,构建互为主备的双活站点。
在双活网关方案中,浪潮InCloudSphere SRM组件同样可以提供虚拟机粒度的容灾对象选择,提供容灾演练、计划性迁移、灾难恢复等能力,双活硬件网关提供同步读写主备存储数据的能力,实现实时数据同步。对于重要业务,InCloudSphere SRM可以控制iCenter创建占位虚拟机,并且优先启动,做到RPO和RTO均为零。对于普通业务,SRM控制批量启动虚拟机,在虚拟机启动成功后,用户业务可从站点整体故障中恢复。
浪潮InCloud Sphere通过提供多维度的云平台容灾整体解决方案,让用户可以根据自己的实际需求,选择适合自己业务系统的云平台容灾方案。
最后,我们用一张表总结一下在单站点、多站点两种方式下,三种容灾方式下的能力展现,帮助用户更好地选择适合自身的云容灾方式。