【IT168 资讯】ILM到底是厂商们酒瓶装新酒的花招,还是您真的可以通过它来达到降低运营成本、提升效率的目的?
尽管各个硬、软件厂商都争先恐后地以自己的产品来定义信息生命周期管理(ILM),然而ILM事实上只不过是确保企业存储基础设施能与其数据的实际商业价值紧密挂钩、使两者达到非常好的匹配的一个理念。有些厂商和分析师表示,基于政策的工作流程能够在确定数据价值发生变化时自动将存储设施和数据价值进行重新匹配,从而确保不同价值的数据存放在相应价值的存储设备上。
ILM根据数据的价值对存储资源实现最经济有效的分配,这种理念可以通过一个标准架构,即内部服务提供模式(internal service provider model)来实现,这种架构能够在服务水平协议(SLA)下,基于不同的成本提供功能各异的不同层次的服务。这也是SNIA(存储网络行业协会)为ILM下的定义。
在上述这种服务提供模式里,每个层次的服务都由一个符合该服务特性的相应技术架构来支持。服务提供能力的区别取决于不同服务的特性,这些特性同时也决定了不同存储层的不同成本。考虑到部署ILM的成本和效益问题,您首先要弄清楚为什么要部署ILM,是实际业务需求、还是为了提升IT效率而使您部署ILM?您只有真正清楚的了解部署ILM的原因,才有可能选择合适的标准架构(软硬件)。此外,您还要谨防厂商从硬件方面来迫使您部署ILM解决方案的危险。
在部署ILM之前,有几个问题需要您通过多方讨论来回答:层与层之间的数据迁移将由什么来决定?数据生命周期管理(data life-cycle management,DLM)和信息生命周期管理(information life-cycle management,ILM)到底有什么区别?数据的价值如何进行计算?数据价值的变化达到何种程度才足以产生迁移?结构性数据和非结构性数据是否需要采取不同策略?ILM是否会根据应用的不同而具体定制? 由ILM策略驱动的数据迁移对灾难恢复能力有何影响?对ILM环境进行管理和控制的成本是否会耗费掉预期节省的资金?怎样对待处于生命周期末期的数据(即如何清除数据)?
上述问题的答案其实是互相关联的。CIO们在选择正确的ILM战略前需要对以上这些问题所涉及的每个领域都有全面、清楚的认识和了解。本文只是简单地探讨一下其中几个最具争议的话题。
管理数据还是管理信息?
数据和信息到底区别在哪儿?这种对生命周期管理有何影响?数据和信息既有联系又有区别:数据是信息的符号表示,或载体;信息则是数据的内涵,是数据的语义解释。数据是信息存在的一种形式,只有通过解释或处理才能成为有用的信息。数据可用不同的形式表示,而信息不会随数据不同的形式而改变。
虽然厂商们奋力向用户们推荐信息生命周期管理方案,但是我们必须承认:今天,几乎所有企业所执行的生命周期管理实际上都是数据生命周期管理(DLM),而非信息生命周期管理(ILM),因为他们所管理都是那些应用程序用来提供信息的数据文件,而非信息。
如何决定数据的价值
是否按照最广义的价值定义、以主观的方式比如“重要性”来决定数据的价值?如果数据在其生命周期内将基于其价值的变化而实现自动化迁移,那么对数据价值的决定就需要一些经验标准。这些经验标准可以包括业务影响分析、企业利润预测、业务发展预测等等。所有这些都可以用来决定数据的静态价值,当然这种价值可能更准确的反映了数据的应用价值。
为了最大程度地符合ILM的定义,决定数据价值的经验标准必须能够发现当前数据价值的变化并进而将其迁移至相应的存储层中。但是,您怎能在假设的情况下使这种静态的数据价值对变化做出准确地反映呢?因此,数据的价值需要直接和某种动态变化的实体相挂钩,这种实体可能是数据处理的次数,也可能是处理的平均价值。然而,为了计算每个应用或每个业务部门的数据价值而去建立一套机制或监测体制现实吗?要制定出一个能够动态的对业务改变作出反应的数据价值机制,从而引发基于策略的数据迁移,退一万步说,对任何企业而言都是相当具有挑战性的。而且,为了满足ILM以数据价值为基础、基于策略的数据迁移的终极目标而为每个业务部门和应用都建立一套这样的机制现实吗,或者说,划算吗?
该由什么来决定迁移?
有一点很重要,我们必须了解到数据既可以因价值增加而迁移至上一层存储层,也可以由于价值的降低而迁至下一个存储层。假设您能够计算并长期保持数据的价值,那么现在您需要问的问题是:价值变化达到何种程度才足以进行数据迁移,将其迁移至更合适的存储层上呢?这或许是关于ILM的问题中为数不多的简单问题之一,因为当我们在建立服务提供模式时就已经知道应该如何回答这个问题了。
服务提供模式会将业务需求进行分类并使其与相应的服务层相挂钩,而每个服务层都有自己的一套成本模式。关键问题是:您多长时间才会碰上一次数据价值变化到要求进行迁移的情况?是每天、每周、每月、每季度还是更长的时间呢?这时人们会意识到,频繁的价值大变动(例如每天或每周变化一次)会对数据的可用性产生巨大的影响,因为数据需要按照这种频率来进行迁移。或许有些方法可以将数据迁移对生产的影响降至最低,但可能要以您无法接受的高成本或复杂性为代价。如果这种价值变化发生得不那么频繁,那么您还有没有必要投资那么多财力精力在数据迁移自动化上呢?更不必说这种自动化还会对系统复杂性造成影响、以及给管理成本方面带来影响。
要评估数据的价值很困难,要制定一套能够持续不断评估其价值的方法就更困难了,而在自动化迁移过程中运用价值评估的变化就难上加难。在一个指定的时段为数据价值的估算实施一套日历程序,这样或许更有效而且更现实可行。这个时段可以是季度性的也可以由业务部门来指定。就目前而言,要实现发现价值变化并进行数据迁移的过程还不太可行。可行的是,对其他属性进行监测,比如创建日期或最后一次访问的日期等具体数据操作信息来决定其价值的变化。
ILM成功 DLM是关键
可以想象的到,只要元数据存在,那么制定ILM策略就会有多复杂就多复杂,能多繁琐就有多繁琐。虽然目前为止还没有一个企业能够实现真正的信息生命周期管理,但是我们不可否认严格、条理明确的数据管理战略是任何一个有效的ILM战略的基础。换句话说,符合ILM要求的DLM解决方案是企业实现ILM战略的关键。
我们以人们理财方式的发展历史为例,来帮助大家更形象的理解一个有效的系统架构如何能够帮助企业获得最大的投资价值。在过去,您如果想存钱的话非常简单:把钱给到银行,银行会替你保存,不论你想存长期还是短期,银行都是以同样的方式来保存。今天情况就不同了,个人或企业会根据投资目的和时间价值的不同来选择各种不同的金融体系和理财产品来管理钱。例如,短期资金会存入活期存款户头,数月不用的钱可以存成定期存款或购买国债,长期闲置资金可能会投资在股市或公司债券上。
信息技术让我们可以对钱的流通和管理实现自动化。现在,我们的薪水可以自动到帐, 经纪帐户内的闲余现金可以自动投入金融市场基金,分红也可以进行自动再投资。自动转账功能替代了开支票。个人金融软件已经和互联网挂钩,我们可以通过互联网随时查阅自己的帐户活动记录、了解自己的财务状况。相关的法律法规对金融机构报告帐户信息的准确性有相应的规定,违反这些法律法规都可能带来法律处罚或罚款。
由于法律法规对文件保留和查找的要求日益严格,当今的企业再也不能像以前银行存钱那样来储存业务数据了。为了确保ILM的有效性,DLM解决方案必须从数据进入系统的那一刻起直到被删除的刹那,确保数据能够在各种类型的存储设备上进行自动迁移。这种自动化且基于政策的系统必须能够处理对数据的分类、加密、隔离、迁移、保护以及保留。