【IT168 专稿】以前一谈到网络存储(SAN),人们首先想到的就是光纤通道(FC),不仅服务器主机、SAN交换机要支持光纤通道,就连所连接的磁盘阵列,以及阵列中的磁盘都要支持光纤通道,提供光纤接口,其成本是可想而知。其实在企业中,由于存储的数据重要性级别不一样,关键数据所占比例通常不到整个存储数据容量的一半。如果把所有数据都用价格昂贵的光纤通道磁盘阵列来存储,显然其代价有些过高。正因这种原因,许多企业就想,是否有一种方案可以实现企业数据分级存储呢?就是在一个存储系统中,提供成本、性能各异的多种磁盘存储子系统选择,组成一个混合存储系统,对于企业关键数据选择高性能的光纤通道存储方案,而对于一些不是很重要的可以选择一些性能和成本都相对较低的其它存储方案。这样就既可以使得整个存储系统性能得到充分发挥,又不至于造成投资浪费。这一要求随着各种磁盘接口技术,特别是SATA(串行ATA)磁盘接口技术在磁盘阵列中的成功应用,开始得以实现。
一、分级存储的意义
4数据分级存储,是指数据客体存放在不同级别的存储设备(磁盘、磁盘阵列、光盘库、磁带库)中,通过分级存储管理软件实现数据客体在存储设备之间的自动迁移。数据迁移的规则是可以人为控制的,通常是根据数据的访问频率、保留时间、容量、性能要求等因素确定的非常好的存储策略。在分级数据存储结构中,磁带库等成本较低的存储资源用来存放访问频率较低的信息,而磁盘或磁盘阵列等成本高、速度快的设备,用来存储经常访问的重要信息。
数据分级存储的工作原理是基于数据访问的局部性。通过将不经常访问的数据自动移到存储层次中较低的层次,释放出较高成本的存储空间给更频繁访问的数据,可以获得更好的总体性价比。在磁盘阵列中的分组存储,就是根据具体应用的不同需求把数据存放在不同类型的磁盘阵列子系统中,不再采用单一技术的磁盘阵列,而是把各种技术的磁盘阵列混合使用,可以提供最好的投资保护。
事实上,数据具有生命周期,不同的时期有其存在的不同意义。在数据刚生成的数日内,访问频率最高,为企业产生效益和收入,带来的价值也最高;随着时间的推移,访问频率降低,数据的价值也随之下降,低访问频率的数据量远远超过高访问频率的数据量,如果全部用企业级存储产品来存储所有数据,费用非常高,也没有必要。不同生命周期的数据,由于提供给企业不同的服务目的,企业应考虑如何以最低的成本获得最高的价值,而不是采用以往单纯购买更多磁盘的解决方式和态度,徒增存储费用和管理复杂程度。
总之,企业业务数据从产生到存储、利用、归档,最后超过存储期限被删除,数据被读取的频率会逐渐下降,数据存储的位置也应该随之变化,以提高存储设备的使用率,降低存储成本。因此有必要进行分级存储,企业在存储其关键业务数据时,采用昂贵的存储技术和方式,如RAID磁盘、复制、定时拷贝、多级备份等,确保数据高可用;当数据已经不再为企业带来效益时,将这类数据迁移到较便宜的存储介质上;最后,当数据“老化”到不再被访问时,应考虑将其删除或者迁移,如果是法律要求或政府规定等要保留多年的数据,应将其迁移到近线磁带库或者离线存储介质上进行归档,既安全又节省费用。
对于关键数据,如数据库系统和与企业核心应用相关联的数据。在目前的存储技术当中,光纤通道磁盘(FC)阵列是理想的选择。这种全光纤存储阵列包括磁盘阵列与服务器主机的连接和阵列内磁盘与阵列控制器的连接都采用光纤通道。由全光纤阵列组成的存储环境具有最高的性能和可用性,当然价格也最昂贵。
对于一些利用率很高但不是关键应用的数据,典型的应用包括Email、一些CRM/ERP应用、多媒体文件和部门级文件数据,则根本没有必要采用全光纤的磁盘阵列系统。其实完全可以采用其它通道类型,包括FC-FC、FC-SCSI、FC-SATA等,也就是说磁盘阵列可以采用主机接口为光纤通道类型,而磁盘阵列内的磁盘与控制器的连接可以采用相对便宜的SCSI或SATA。或者两个接口全采用SCSI或SATA,与主机的连接通过一个转换器用SCSI或SATA电缆进行连接。