存储 频道

数据归档放到不同的存储层绝非易事

        【IT168 资讯】数据归档还是比较常用的,于是我研究了一下数据归档,在这里拿出来和大家分享一下,希望对大家有用。当对存储的需求量越来越大的时候,单纯地把公司所有数据存放在昂贵的高性能的FC磁盘上是不切实际的。

  分层存储理念的出现是为了节省成本,将业务关键数据存放在最快速的磁盘平台上,而将价值相对较低的数据放在速度较慢价格较低的存储上面,比如SATA磁盘甚至磁带。在很多情况下,公司会建立基层不同的存储层,但是,要把所有的数据放到不同的存储层上绝非易事。

  首先,数据必须分类,就需要了解每一个文件或文件类型的相对价值。只需要偶尔访问的数据类型,比如电子邮件,经常存储在自动数据归档工具上。然后,数据还需要在不同的存储平台之间进行迁移,以便根据分类来进行存储。这份购买指南介绍了购买分层存储产品所需要考虑的主要因素。

  提前制定数据留存策略。很多公司必须将某些类型的数据保留一定时间以满足法规遵从的要求,然后在留存时期期限过后将数据删除。然而,留存策略并不是自动设置的,没有软件可以告诉你某个数据需要保存多长时间。相反的是,只有了解每个类型数据的价值才能制定策略,这是与法规遵从相关的。数据迁移和数据归档工具可以用于执行已经制定好的留存策略。

  提前制定数据分类计划。数据分类也不是自动的,没有软件可以确定您自己的公司的数据的实际价值,因此不要依赖数据分类工具来帮助您分类。数据分类是一个人工的过程,需要了解到多个部门的具体情况,比如人力资源部门、财务部门等。

  一旦你已经确定好每个数据类型的相应的价值,数据分类工具就可以找到数据,应用元数据并执行已经制定好的留存策略。专家发现绝大多数成功的分层存储部署都出现在数据分类和留存策略已经成熟并得到认可时。

  考虑到分层存储系统所增加的管理成本。分层存储经常涉及到对多个存储系统的利用,有些时候这对于存储管理员来说意味着负担的增加。比如,第一层存储可能是在FC SAN上,第二层存储在SATA NAS上。

  第三层存储在内容可寻址存储数据归档系统,虚拟磁带库或磁带库上。对于一些公司来说,多个存储层所增加的成本和管理费用会超过从中获得的利益,专家注意到一些大型数据中心实际上放弃采用分层存储而更愿意采用单一层存储。

  不要过高预期可节省的成本。虽然分层存储的目的是为了节省开支,但是实际情况通常达不到预期。举个例子,业内人士经常说第二层存储的花费比第一层存储的花费少20%至30%,而第三层存储的花费比第一层少50%至60%。然而事实上,专家发现第二层存储的花费只能比第一层减少10%至15%,而第三层只能减少30%至40%。一些企业从分层存储转而采用单一层存储的原因之一也是由于成本节省不如预期。

  购买最适合你需求的工具。你将发现有很多数据迁移、数据归档、数据分类工具能帮助你自动化分层存储环境。但是这些工具在复杂性,成本和性能方面差异很大。有很多例子可以说明这个问题。一些产品可能会经常提供一个相对简易的集中的工具,比如博科公司的Data Migration Manager,Enterprise Vault。

  同样的,你还可以选择一个用于特定存储平台的工具,比如EMC的SRDF,或者选择一个更加异构的工具,比如Incipient 公司的 Network Storage Platform (NSP)。最后,一些工具可能会针对特定应用,比如Mimosa Systems公司的NearPoint for Microsoft Exchange Server,而其他工具可能会支持多项应用。专家建议你购买产品时注重满足最低的性能标准,而不是一些潜在的不需要的增值功能弄得焦头烂额。

  考虑到性能改善的可能性。当所有数据放在一个单一的存储层上时,用户访问和应用访问的冲突反而会影响存储系统的性能。当在多个存储层之间分散访问时就可以缓解这种冲突。即使SAS或SATA存储的性能会低于FC存储的性能,将访问冲突缓解时实际上也会保障SAS或SATA层的高性能。同时,由于减少了对FC存储的访问需求数量,第一层FC存储的性能也能改善。

0
相关文章