存储 频道

初志集群存储解决方案助力高校数据中心

  【IT168 方案】目前,从高校信息化建设进程来看,很多高校已基本完成了基础网络架构和计算平台的架构,进入以数据为中心的信息整合阶段。数据库、一卡通、OA系统、数字图书馆、数字视频教学、科学研究、科学计算、教学管理等新应用,产生了大量需要储存的数据,该类数据主要分为结构化数据和非结构化数据。如何保证数据信息的稳定和安全,满足教学和管理等应用的需求,成了高校信息化必须关注的问题。

  通常高校的数据中心是整个校园信息化的核心,中心的存储系统需要为整个校园网络提供数据存储支持,它的运行状况将直接影响到整个网络系统的访问速度、运行效率以及大量重要数据的安全和稳定。因此必须强化数据存储核心,其基本性能需求分析如下:

  1、存储系统架构要求:由多台存储阵列并行工作,数据从多台存储设备上存储和读取,以获得更高的性能和扩展。降低单一存储系统的故障风险。实现数据共享,负载均衡,故障自我修复,易用易管理等特点 。

  在存储系统中,处理器主要完成I/O处理、cache控制管理、数据传输控制以及一些智能化的软件功能,处理器的能力直接影响到整个存储系统的性能。因此存储所采用的控制器数量及性能, 实际处理器配置数量、cache大小,将影响整个系统的性能指标。

  2、海量文件高效检索效率要求:当数据量不断增长,存储系统里面的文件数量也会快速增长。当存储系统内的文件数量增长到数千万以上时,文件的检索查找等操作将会给文件系统带来巨大的压力,特别是一个目录下面存放的文件超过一定数量甚至会造成文件查找效率急剧下降。将元数据应用采用集群架构,与数据存储集群分离,减少相互之间的干扰,提升数据读写的效率。

  3、存储系统可靠性要求:可靠性是整体系统可靠性的重中之重,多台服务器共享存储资源,一旦存储产生严重故障,业务服务必然全面停滞,甚至导致致命的数据资源损坏。因此,存储系统要求无单点故障,必须具有强有力的可靠性保障。采用传统的RAID数据保护技术,只能从硬盘级别保护数据,随着数据的增长,磁盘数量多,容量大,硬盘故障的几率增加,恢复时间长,RAID技术不能满足实际应用的需求。从数据的安全性和应用的连续性考虑,要求存储系统允许整机宕机的情况下,仍能保证业务的连续和数据安全。

  4、数据共享管理:整个数据中心将结构化数据和非结构化数据分别存储到两个大的存储池中。

  结构化数据集群存储节点服务于数据库服务器,满足高IOPS的数据库查询应用。

  非结构化数据集群存储节点,采用文件系统全局命名空间,所有应用服务器都可看到一致文件系统视图,也可以针对不同的应用将不同的服务器挂载在存储系统中不同的子目录中,让不同应用的服务器只能看到本应用的数据。数据的全局共享可以加强同一应用不同服务器之间的协作,提高了应用的服务效率。使得在系统中通过单一节点即可对存储系统中所有的数据进行管理和备份,满足高聚合带宽和高并发的应用。

  5、系统使用管理要求:配有简单易用的中文图形化管理和监控界面。通过专用的安全通道进行远程配置和全系统监控,能够智能的发现各类软硬件故障并进行处理,减少了管理员的工作量

  6、可扩展性及负载均衡功能要求:存储系统要能够在线的进行扩展,以利于整个应用系统的平滑升级。可以通过配置工具动态添加存储阵列以扩大系统的容量和规模,而且随着存储阵列数据的增多,整套系统的聚合带宽也会线性的增长,完全可以满足业务不断发展所产生的容量和性能需求。系统具有负载均衡功能,消除系统中负载不均导致的热点数据问题。

  7、新老校区数据中心的数据共享与容灾:为了能够充分发挥新老校区数据中心构成的整体系统架构的能力、充分利用物理网络带宽、能够同时满足各个不同区域用户各自独特的需求,要求存储系统能够在全局范围内智能管理数据的布局,即:全局统一管理存储在各个数据中心的所有文件:根据每个文件在地理区域上和时间上被用户所访问的动态信息,实时自动调整文件在各个数据中心的部署,能够动态选择存储某个文件的物理数据中心、以及在数据中心内部数据存储的冗余度;新老校区数据中心结点之间的文件部署分发调度具有高速传输支撑,构建在Internet之上或专门的网络线路,占用系统资源可控,整个传输过程可管理:文件的跨域访问和调度粒度可以达到文件块级别;充分利用系统的空闲资源,具有多种策略实现文件在全局范田内的动态部署和迁移,能够控制对带宽和其他资源的使用,达到与应用系统友好共存;全局文件系统能够与应用系统紧密结合,实时接受由应用系统提供的文件访问信息进行全局文件的部署;自动为各个文件进行跨数据中心远程容灾备份,确保部分数量数据中心失效的情况下,应用仍然能够访问到所有的数据;

  2、 集群存储简介

  集CZSS集群存储是由多台存储并行工作,数据从多台存储设备上存储和读取,以获得更高的性能和扩展。降低单一存储系统的故障风险。植入软件功能优化硬件本身的复杂性和固有刚性,实现数据共享,负载均衡,故障自我 修复,易用易管理等特点 。

  CZSS集群存储系统主要由元数据服务器集群、集群存储节点智能引擎、集群存储阵列集群三大部分组成。

  元数据服务器集群:管理文件系统的元数据(包括文件目录树组织、属性维护、文件操作日志记录、授权访问等),管理整个存储系统的命名空间,对外提供单一的系统映像。

  集群存储节点智能引擎:引导存储服务器,实现集群存储功能,存储节点集群系统控制软件许可,包括存储设备管理,网络设备管理,权限管理等。

  集群存储节点阵列:存储用户的实际数据,是整个集群存储系统的存储资源提供者

  3、 使用CZSS集群存储系统

初志集群存储解决方案助力高校数据中心

  如上图所示,高校中的数据库、网站、邮件、视频监控、数字图书馆、校园一卡通数据库和数据备份等应用与CZSS进行通信以完成数据IO。

  本方案我们在新老校区各采用4个存储节点,磁盘裸容量40T,采用SAS和SATA混插。SAS用于数据库应用。用全局文件系统实现新老校区的数据同步共享及远程灾备。在高校信息化综合应用中,CZSS有如下特点:

  海量数据高效管理:随着应用的持续运行,存储系统中将积累大量的数据,这就需要存储系统能够容纳海量的数据。CZSS集群存储系统单卷可支持PB级的存储空间,高效的管理上百亿个文件,单目录可以高效支持千万级的文件数量。这些特性对于检索效率要求较高的应用非常重要。

  海量文件高效检索:当数据量不断增长,存储系统里面的文件数量也会快速增长。当存储系统内的文件数量增长到数千万以上时,文件的检索查找等操作将会给文件系统带来巨大的压力,特别是一个目录下面存放的文件超过一定数量甚至会造成文件查找效率急剧下降。

  高性能:在高校环境内,应用种类多,并发访问的程度较高,这给存储系统带来较大的IO压力。CZSS集群存储系统通过多台存储服务器提供同时数据存取服务的方法以满足大量应用服务器的并发访问需求。在应用服务器端,当应用程序往存储系统上写文件时,文件将会被根据一定大小进行分片存放到多台存储服务器上;在应用程序读文件时,则并发的从多个服务器上读取数据。由于大量的数据IO请求都被分散到多台存储服务器上,使得所有的存储服务器上的磁盘性能和网络带宽都可以同时得到充分的利用,这样CZSS集群存储系统的聚合带宽由多台的存储服务器上的IO带宽相加而成,从而克服了NAS的单一出口点所造成性能瓶颈,可以满足多台应用节点并发访问的带宽需求。

  通过实现多存储服务器的并发数据访问支持,消除了传统存储系统中常见的负载不均导致的热点数据问题。CZSS通过数据在存储服务器集群中的条带化分布实现高效、全面的负载均衡功能,充分利用硬件和网络的性能,发挥出最高IO吞吐量。

  全局共享:CZSS集群存储系统采用文件系统全局命名空间,所有计算节点都可看到一致文件系统视图,也可以针对不同的应用将不同的服务器挂载在存储系统中不同的子目录中,让不同应用的服务器只能看到本应用的数据。数据的全局共享可以加强同一应用不同服务器之间的协作,提高了应用的服务效率。而且数据的统一管理也方便用户数据的统一管理,使得在系统中通过单一节点即可对存储系统中所有的数据进行管理和备份。

  高可靠性:CZSS内置一套完整的故障恢复流程,消除了单点故障。集群中的硬件故障和人为误操作都会以正常的恢复流程进行自动处理,整个流程对用户完全透明。任何硬件故障都无需进行手动处理,用户唯一的管理工作的就是在容量不够的时候添加硬件和用新的硬件替换损坏的硬件。种种高可用机制保证了CZSS能够24×7小时不间断的提供稳定的存储服务。

  动态扩展系统负载均衡 :CZSS集群存储系统可以支持动态的扩展存储容量,而无需中断应用的运行。用户可以通过CZSS的配置工具动态添加存储服务器以扩大系统的容量和规模,系统负载均衡,而且随着存储服务器数据的增多,整套系统的聚合带宽也会线性的增长,完全可以满足业务不断发展所产生的容量和性能需求。

初志集群存储解决方案助力高校数据中心

  而工业标准的通用硬件良好的兼容性和可获得性方便了整套存储系统将来的使用和扩展,CZSS支持在1小时内部署上百TB的存储系统,无缝的在线增加存储容量。

  简易管理:CZSS存储系统配有简单易用的图形化管理和监控界面,支持通过专用的安全通道进行远程配置和全系统监控,能够智能的发现各类软硬件故障并进行处理,减少了管理员的工作量。

  无缝兼容现有环境:CZSS存储系统的设计是面向通用的硬件和软件环境,如使用通用的以太网络作为数据传输通道可以确保充分利用现有的环境,并且可以无需对环境做出任何修改。另外CZSS能够直接支持Linux、Windows和MacOS等常用的操作系统之间进行数据共享,无需对操作系统做任何修改,所以能够无缝的接入到高校现有的软硬件环境。

  4、新老校区数据共享和远程灾备

  为了能够充分发挥新老校区数据中心构成的整体系统架构的能力、充分利用物理网络带宽、能够同时满足各个不同区域用户各自独特的需求,要求存储系统能够在全局范围内智能管理数据的布局,即:全局统一管理存储在各个数据中心的所有文件:根据每个文件在地理区域上和时间上被用户所访问的动态信息,实时自动调整文件在各个数据中心的部署,能够动态选择存储某个文件的物理数据中心、以及在数据中心内部数据存储的冗余度;新老校区数据中心结点之间的文件部署分发调度具有高速传输支撑,构建在Internet之上或专门的网络线路,占用系统资源可控,整个传输过程可管理:文件的跨域访问和调度粒度可以达到文件块级别;充分利用系统的空闲资源,具有多种策略实现文件在全局范田内的动态部署和迁移,能够控制对带宽和其他资源的使用,达到与应用系统友好共存;全局文件系统能够与应用系统紧密结合,实时接受由应用系统提供的文件访问信息进行全局文件的部署;自动为各个文件进行跨数据中心远程容灾备份,确保部分数量数据中心失效的情况下,应用仍然能够访问到所有的数据;

初志集群存储解决方案助力高校数据中心

0
相关文章