存储 频道

和BridgeHead谈归档的ILM

【IT168 资讯】长期信息归档的问题主要来自与日剧增的电子邮件和非结构化文件的数量,而法规遵从则必须满足外部法规的要求。但无论是进行信息归档还是法规遵从流程,大多数存储基础架构的要求是相同的。

从某种角度上讲,内容归档并不是一个很新的需求,2000年之前就已存在,只是随着法律法规对此方面的要求越来越严格,随着信息沟通能力成为企业核心竞争力的一部分,企业需要长久保存和随时调用的信息每年在以2倍的速度增长,已经达到了海量的程度,直接促使实现内容归档的产品和解决方案日臻完善。

而随着电子商务应用呈爆炸式增长,国内外针对电子邮件的相关法律法规越来越明确,而且电子邮件所管理的信息每天在跳跃式地增长,已成为业务交易的重要媒介,这些交易记录必须作为公司资产不能只是由每个人来保管。每天成千上万产生的电子邮件和业务文档,同时占据了用户和服务器的很多空间,这也直接影响了应用的性能,加大了企业计算机部门的负担,一个有效的电子邮件归档解决方案就显得极其重要,并成为内容归档的一个重要分支。

数据生成后,随着时间的推移,其访问频率将逐步下降,数据被保留的时间越来越长,被消除的数据越来越少,重视TCO(整体拥有成本)的企业,都需将不常访问的数据迁移到较便宜的介质上,节省存储投资。因此,企业在进行内容归档建设之前,首先要对需要归档的业务数据进行分类,然后根据数据的容量、保存的时间、访问的频率,反应的速度这四个必须考虑的因素,进行量身定做。

关于归档针对的数据,ESG(企业存储研究集团)提出了“可访问的信息”(Reference Information)概念,“保留这些数字资产(即内容归档)的目的是为了提供参考和产生价值”,“它包括(但不仅限于)电子文件,如:合同、email、email附件、讲稿、CAD/CAM设计、原代码、Web内容;以及一些数字化的影像信息,如:支票影像、蓝图、历史文件、医疗影像、地理数据、生物信息、录像、声音数据、以及照片。”而在文件归档的专业厂商BridgeHead的,全球销售高级副总裁Ryan Witt看来,BridgeHead把文件分成四种

  • 结构化的 (数据库)
  • “近结构化的” (邮件、组件)
  • 由应用产生的工作流文件
  • “非结构化” (普通文件)


在这些文件类型中,非结构化的文件占到了最大比例。而且,这类文件的自由度很大(比如用户可能会自己更改文件名),增长率也很高,文件系统也没有为每个文件做具体的描述,最重要的是,这类文件中经常用到的很少,很多文件都是闲置的。因此,对非结构化文件的管理成为了归档管理中最大的难点。Ryan Witt认为,这不同于EMC Documentum这类的文档管理软件,BridgeHead所肩负的任务更靠后,面对的是在归档过程中如何对文件进行管理的问题。

BridgeHead从创建之除,就立足于归档/备份领域,在文件归档市场逐渐升温的今天,他们也看到了中国存储广阔的市场。由其全球的合作厂商Plasmon的配合,BridgeHead正式进入国内。前不久,其全球销售高级副总裁Ryan Witt先生来到国内,笔者就如何定义归档文件的ILM与其进行了深入探讨。

目前,BridgeHead的主力产品包括了用于文件归档的HT FileStor、用于多路径应用归档的的HT Data Repository、用于企业备份的HT Backup和用于企业存储设备与介质管理和HT OpenMedia。而对于其他相关类型的文件归档管理,Ryan Witt表示将借助于合作伙伴的成熟软件予以配合使用,比如QUEST的邮件归档管理软件和Grid-Tools的数据库文件管理工具等。在上述软件之中,HT FileStore又是最为关键的部分,其通过对存储上的文件属性进行扫描和分析后,将存储上的空间分成了5个部分,分别是:

  • Free Space:空闲的存储空间;
  • Unlikey to be accessed:不太可能访问的内容;
  • Static Data:静止的数据,有可能会用到;
  • Active:活动的数据,经常被用到;
  • Unwanted:不需要的数据,比如临时文件等。

0
相关文章