存储 频道

浅述存储系统的容错

【IT168 资讯】一种传统的存储方法是使用服务器自身连接的存储设备,但服务器所能增加的存储容量十分有限。给服务器中增加附加的硬盘驱动器不仅需要精确的操作技术,而且更重要的是经常会给网络带来宕机时间。一种更好的解决方案是使用外部磁盘驱动设备,对存储的需求做快速配置响应。外置磁盘自带风扇制冷系统、电源供给、外部总线接口连接器,维护起来十分方便快捷。 

  JBOD
  JBOD(Just Bundle Of Disks)可译为“简单磁盘捆绑”,通常又称为Span。JBOD专门为存储设备设计,它是一个外部附加存储解决方案,可以容纳多个磁盘驱动器。不像外部单独的磁盘驱动器,JBOD支持多个磁盘系统的电源和风扇冷却系统合并。驱动器插在一个内部总线上,将服务器与JBOD系统之间的外部总线线缆简化成单条线缆连接。JBOD中的磁盘阵列有着严格的制冷系统和电源设备,这些都是容错的重要体现。

  RAID容错
RAID是单点故障的标准解决方法。RAID中的磁盘阵列可以保证其中的任何一个磁盘出现了故障都不会导致用户数据的丢失。RAID有多种等级,其中RAID1提供了简单的镜像。RAID0将数据拆分成不同的模块,然后把它们同时存放到不同的磁盘中。但由于RAID0不具有容错能力,所以RAID0经常和RAID1一起使用。RAID0经常被使用到比较大的数据存储中,并且这些数据要经常读写,比如影像文件等。 RAID5是应用非常普遍的容错等级,它需要三块以上的磁盘。比起完全的磁盘镜像来说,RAID5要快速并且经济得多。所以,包括电子邮件、新闻和数据库系统都可以应用RAID5方式。

  RAID控制卡的容错
容错系统允许冗余的RAID控制卡,其中的一个通道出现问题并不影响用户对数据的操作。 有两种双RAID控制系统:一种是两条激活的RAID通道,另一种是一条激活的通道和一条备用通道。在第一种双通道系统中,两条RAID通道是相互独立的,各自完成不同的操作,这两条通道可以为不同的主机服务,在双通道中还用一个叫做“心跳”的常规检查来测试控制卡的状态。其中一个通道的RAID控制卡出现了问题,另一个会自动接替它的工作,保证数据的访问工作。当坏的控制通道更换后,系统又会自动回到原来双通道的状态,用户的数据访问不会受到任何影响。

另一种方式是激活/准备状态的双通道配置,激活的通道负责全部磁盘的管理。通过“心跳”的状态报告,准备状态的通道随时检查激活通道的操作。如果激活通道出现了问题,准备通道会及时接管所有的控制任务,直到激活通道被修复。这种操作对于用户也是透明的,用户不受任何影响。

  主机总线适配器容错
在服务器等级,可以通过建立多条从服务器到数据存储系统的连接路径来完成更高级别的容错系统,这就可以使用双主机总线适配器(dual host bus adapters,HBA)。服务器上的相应软件负责监控这些冗余路径的状态,实现高层次的容错。如果一条路径被故障中断,软件可以切换到另一条路径上,就像冗余的RAID控制器之间的“心跳”一样,不同的冗余路径之间也有“心跳”,如果一条路径出现了问题,它会给“心跳”一个信号,数据访问路径会自动切换到其他的冗余路径上,这丝毫不会对用户的使用产生任何影响。

  群集容错
比多路径的冗余容错更高一级的就是服务器的群集系统了,不管服务器的哪些部件出现问题,它的工作都可以通过备份机来完成,用户的存储工作不会受到影响。群集有多种方案,小型应用有双机备份,比较大的应用可以有异地容灾系统,其中就包括了数据的存储设备。较高级别的群集系统容错可以应付多点故障。
 

0
相关文章