存储 频道

构建自己的网络存储系统

    【IT168 专稿】近年来,网络存储行业大有"山雨欲来风满楼"之势。先是如光纤通道和SSA等专门为存储技术开发的协议;后又有SAN、NAS及ESN等各种存储体系结构的出现;如今,iSCSI、iFCP、iSNS等新技术和新概念层出不穷。

    在厂商方面,存储行业已经完全成为IT业的主流行业之一。实力对比上,也由原来的EMC一家独大,进入了百家争鸣的阶段。IBM、HP、Compaq、Sun等传统主机厂商纷纷进军这一领域,其中IBM的力度之大,尤为令业内人士关注。继02年倾力推出重量级存储产品--Shark之后,03年初,IBM与Compaq正式签署了一份互换存储产品的协议,进一步扩充和增强自身产品的竞争力,并且在全球范围内整合公司,成立了名为SSG的开放平台存储产品事业部。该部门从4月20日开始的全国巡展,其命名--点燃存储烽火--正显示了IT行业的变化。

    究其原因,是由于企业IT系统从面向流程逐渐转化为面向信息本身,使得今天的企业IT系统正悄然进行着迁移和重构。事实上,从支撑应用系统的基础信息体系结构来看,传统面向流程的应用系统,基本需求是对流程的管理和对交易的处理,因此在建立信息体系结构时,核心内容是计算能力,其次是数据传输。因此在搭建基础结构时,重点往往在选择服务器、操作系统、网络设备等。

    当应用需求逐步转向面向数据应用时,尽管服务器、网络设备仍然是基础体系结构的重要组成部分,但这些设备已经难以提供面向数据的应用系统对数据集中、密集数据存取、海量数据、实时数据分发、数据整合、数据管理、数据交换、数据迁移、数据重用、数据分发、数据安全性、数据可管理性的要求。越来越多的应用系统实施实例表明:数据仓库系统、决策支持系统、Load balancing、集群系统、备份系统、容错系统、高可用系统等等,今天和未来的热点工程,如果没有对于存储技术的专业理解和丰富的实施经验,是根本无法进行设计和规划的。对数据应用系统基础体系结构进行设计和规划的重点,已从传统的以服务器、网络设备为核心演化为以存储系统设计和规划为核心。

    什么样的企业需要存储?答案是:任何企业都需要。因为,今天企业的核心问题之一就是信息,研发是信息问题,市场是信息问题,商务是信息问题,管理还是信息问题。而建立存储系统的目的,就是信息的保护,信息的管理和信息的共享。建立一个良好的存储系统,可以帮助企业保存好重要的内部信息,维持企业正常业务的进行;还可以帮助企业更好的利用信息,增强自身竞争能力;甚至可以帮助企业实现更先进的业务流程和模式,大幅度提高企业的工作效率,继而提高在同行业中的地位。

    目前,存储行业已经清晰的分为四大部分:以磁盘阵列为主的在线存储系统厂商,以磁带设备为主的离线存储系统厂商,存储管理软件厂商,交换设备和主机适配器等周边设备厂商。一个典型的数据存储系统也就基本由这四部分的产品构成。虽然像IBM、EMC这样的公司总是习惯的声称"可以解决一切问题",但事实上,这些公司只是在其中的一两个方面有很好的产品。至于其他方面,要么采用OEM来的产品,要么弱化甚至忽略掉。最重要的是,厂商很难对用户的具体数据特征做出深入细致的分析并给出具有针对性的方案。所以,在用户还没有足够的能力来自行设计存储系统之前,选择一家有经验的存储专业集成商,是很必要的。

         随着计算机技术的发展,IT领域内会不停的出现颇具诱惑力的新名词和新概念。厂商正是以此为给用户"洗脑"的工具。作为用户,应该充分把握自己的实际情况,不要跟着厂商的思路走。在明确需求的时候,可以咨询有经验的行业专家顾问,或者考察同行业的系统设计和实施情况,万不可把对自己至关重要的业务作了"试验田"

        存储系统的基础和核心地位,决定了这部分的结构变化,往往会造成"牵一发而动全身"的后果。同时,存储系统出现的问题和故障也可能影响到整个IT系统的正常运行。所以,建立存储系统之初就应该考虑到稳定性和结构扩展性方面的要求。保证系统能够稳定而长期的工作。 

存储系统的结构主要包括SANNAS两者。前面已经提到,建立存储系统的目的,就是数据保护,数据管理和数据利用。那么,选择存储系统结构的出发点,也就关注在这三方面。

        就数据保护而言,SANNAS结构都具有非常好的数据保护能力。二者都可以提供冗余结构,实现高效率的数据备份和远程容错。

        SAN结构中通过配置双光纤交换机,主机端双光纤卡和阵列设备双控制器,可以实现高可用的冗余结构。在NAS结构中实现高可用的方式是将两台NAS服务器做集群配置。这两种方式都可以达到令人满意的效果。

      一般情况下,备份效率的高低直接取决于,备份数据是否过多占用网络资源。在SAN结构中,一些备份软件厂商的产品可以实现LAN Free的数据备份,即备份数据通过SAN的光纤连接传输,大大降低了宝贵的网络资源。而在NAS结构中,备份用磁带设备可以连接到文件服务器后端,备份软件通过标准的NDMP协议指挥文件服务器将数据直接备份到磁带设备上,同样可以避免备份数据对网络资源的占用。这两种方式在效果上略有不同,一般地说,当用户的数据在网络中较为分散时,适合采用SAN的方式实现高效的备份。

        就数据管理方面而言,NAS具有一定的优势。其优势主要在于安装配置的方便和快捷。另外,SAN结构中存储设备是被当作本地设备访问的,文件系统和数据的维护在主机端完成。所以,SAN中一般情况下,需要基于主机的数据隔离,即所谓的LUN Masking技术。这种技术主要保证多种操作系统平台不会互相破坏文件系统。NAS结构中,文件服务器是一台提供NFSCIFS共享服务的主机,使用NAS存储空间的其他主机不需要维护文件系统。所以,阵列设备上不需要类似LUN Masking的隔离技术。在文件服务器之上,只需要实现用户级别的访问控制,就可以控制非授权用户的访问。

        就数据利用方面而言,性能是至关重要的指标。SAN结构中其专门面向高性能存储要求而开发的光纤通道协议占尽先机。与传统存储协议SCSI相比较,光纤通道技术在带宽、连接能力、I/O性能、连接距离、扩展能力等方面都大大前进了一步。而且,光纤通道技术支持交换式的连接,可以构建类似于传统以太网结构的庞大而复杂的系统。从而为系统提供极强的扩展能力。而NAS产品的数据传输途径是传统以太网协议,这种协议并不是专门针对存储数据的要求而产生的,它更多涉及到的是关于如何保证连接和交换过程的建立。

然而,由于以太网技术的成熟和普及,NAS在性能方面略逊于SAN之外,也具有先天的技术成熟性和成本低廉的优势。

 总之,NASSAN结构并无绝对的孰优孰劣。用户在选择存储系统结构时,可以从实际情况出发,综合以上几点的分析,选择采用SAN或者NAS作为基本系统结构。

        确定好了存储系统的基本结构,就该考虑选择产品了。下面就如何进行产品选型做一些分析和探讨。存储产品的评价基本可以集中在容错能力、性能、容量、连接性、管理性和附加功能这几个方面。

        容错能力是指在存储设备的设计方面,对各种偶然性错误和意外情况的预期,以及采取的预防或补救措施。这里,用户需要注意的是,存储系统是一个从软到硬的复杂系统,所以,对数据保护能力的评价应当考虑到整个系统。

  一些低端磁盘阵列厂商宣称他们的产品,由于采用了RAID、热交换磁盘、双电源等技术,数据将永不丢失。对一些中小型用户,这些数据保护技术基本可以满足要求,但是对关键性业务的用户来说,这些技术只能算数据保护的最基本前提。对数据完整性的保护,对写缓存的保护,对主机连接的保护以及对远程容灾的支持等方面,往往才能够体现出存储产品的真正数据保护能力.

        存储产品的性能评价是最容易的,因为这一指标可以被充分量化。对磁盘阵列产品来说,性能指数主要有两个:带宽和IOPs(每秒I/O次数)。带宽决定于整个阵列系统,与所配置的磁盘个数也有一定关系;而IOPs则基本由阵列控制器完全决定。在WebMail、数据库等小文件频繁读写的环境下,性能主要由IOPs决定。在视频、测绘等大文件连续读写的环境下,性能主要由带宽决定。可见,在不同的应用方式中,需要考察的侧重点也不同。对NAS产品来说,主要性能指数也是两个:OPSORT。分别代表每秒可响应的并发请求数和每个请求的平均反应时间。对磁带存储设备来说,单个磁带驱动器的读写速度是最重要的性能指标.

      容量是最简单的一个方面,这里需要留意的是,用户不仅要关心产品的最大容量,还要关心厂商推荐使用容量以及扩容成本等问题。

        SAN环境中,以FC连接设备为中心,要连接主机、磁盘阵列、磁带库等设备,环境比较复杂。因此在产品选型时,要充分考虑设备间的连接性。选择具有良好的开放性和连接性的产品,不仅是当前系统正常连接和运行的保障,也为系统将来扩展提供更大的空间和灵活性.

    管理性是任何产品档次的重要方面之一。首先,用户应考虑产品所提供的管理功能或方式,是否实用可靠。举个例子来说,某个大型企业计划购买中心存储设备,但是在招标书中对磁盘阵列的要求,居然有"液晶显示屏""蜂鸣器报警"。任何进入过专业计算机房的人都知道,这两项功能对常年放置在机房的设备来说,没有丝毫用处。其次,支持中心化管理和远程管理的产品一定会令用户省事不少。还有,很多产品的故障自动通知机制给用户带来了方便,但同时也是数据安全隐患。最后,在配置改变或系统扩容时,不需宕机或尽可能缩短宕机时间,是企业级产品的重要特征。

  今天的存储产品,尤其是部门级和企业级的在线存储产品,已经不仅仅是存储数据的盒子,而是一个智能的小型系统。各厂商将很多功能性软件都整合到自己的存储设备中,以向用户提供更好的解决方案。目前,比较常见的附加功能主要有以下几种:数据快照功能,LUN Masking功能,异地数据复制功能等。

  双机热备份和容错系统的目的在于保证系统数据和服务的"在线性",即当系统有错误发生时,仍然能够正常的向网络系统客户提供数据和服务,以使系统不致停顿。而备份技术的目的与此并不相同,确切的说,备份就是"将在线数据转移成离线数据的过程"。其目的在于应付系统数据中的逻辑错误和历史数据保存。所以,在各种容错技术非常丰富的今天,备份系统仍然是不可替代的。

    随着社会的发展,现代企业的流动性大大增加,给企业的数据搬家也是常事。很多企业由于业务需要,都建立了异地的数据分发、数据集中或者数据同步一类的系统。一些用户甚至集成商,都把这种系统称为"数据迁移"。不妥的是,在存储技术中,"数据迁移"这一概念早已有了明确含义,而且与之相去甚远。真正的数据迁移技术(也被称为分层存储管理)是指,由在线存储设备和离线存储设备共同构成的一个协调工作的存储系统。该系统在在线存储设备和离线存储设备之间动态的管理数据,使得访问频率高的数据存放于性能较高的在线存储设备中,而访问频率低的数据存放于较为廉价的离线存储设备中。这样,既可以保证绝大部分情况下系统的性能,同时,大幅度降低了系统成本。

作为IT产业中最夺目的新星之一,网络存储技术的发展令人难以估量。在短短的时间里,NASSAN已经以飞快的速度进入了各种行业的IT系统。从电信到金融,从教育到政府,从制造业到IDC,如今都可以找到网络存储系统的成功案例。同时,新的技术和产品也以前所未有的速度产生出来,丰富和完善用户的信息系统。

    IBMHP公司联合推出的LTO磁带记录新技术,使磁带记录技术又跨上了一个新台阶。这一技术已经可以达到单盘磁带100GB的容量和15MB/s的读写速度。也就是说,磁带设备的读写速度正在追赶硬盘的速度,而单位容量的成本却只有硬盘的十分之一。

   EMC公司的CLARiiON FC 4700 磁盘阵列以中端产品的价位提供了企业及产品才具有的远程容错功能。其高端产品Symmetrix则附加了更多的实用功能,难怪EMC公司从来不把Symmetrix产品称为磁盘阵列,而是恰如其分的称为"企业智能存储系统"

  备份软件的前辈Legato公司,正在完善一种称为Celestra的新技术,这种技术配合SAN结构,可以实现真正的无服务器备份。甚至可以突破现在的"静止状态备份"理念,实现"动态过程备份"

   ATL公司继日前推出了可以直接挂接网络的NAS磁带库之后,又推出了全球先进款可堆叠磁带库。这款命名为M1500的磁带库由若干相同的模块构成,用户可以根据自己的容量需求选择购买一或两个模块,构成工作组级的小型磁带库,随着业务增长再购买新的模块叠加,最终可以满足超大型企业的存储容量需求。

       在所有的新技术趋势中,最为引人注目的当属SoIPStorage over IP)技术。随着SANNAS技术的发展和成熟。许多业内专家都在考虑如何将两种技术的优势融合,在技术上,SAN的缺陷主要在成本高,系统复杂度高,这些都是由于采用光纤通道技术造成的。但是,SAN的最大优势--性能,也得益于光纤通道技术。真可谓"成也萧何,败也萧何"。从另外一个角度讲,NAS产品之所以成本低,系统复杂度低,就是因为采用了以太网这种成熟技术。如何既利用以太网的成熟技术,同时又保留光纤通道或类似存储协议的高效率和高性能,这就是SoIP技术的最主要目的。目前,SoIP在实现方式上分为iSCSIiFCP两大类。前者将光纤通道的底层协议用TCP/IP替换掉,但是保留SCSI-3指令映射,后者则是在TCP/IP协议之上实现完整的光纤通道协议。两种方式都具有各自的优势和适用范围。


     
另外,对InfiniBand这种新型外设连接技术的支持,下一代光纤通道协议的制定以及固态硬盘技术等等,也是一个值得关注的技术方向。

0
相关文章