存储 频道

网络存储概述-作为商用价值数据角色的改变(3)

1.1.2大量的流体数据
没有计算机网络,则不存在网络存储,特别在分布式计算环境下,尤其如此。过去,数据曾经被认为是一个静态的实体,只支持一个特定的应用,而现在它能为不同地点的许多不同的应用所利用,甚至这些应用可以跨越公司的边界。
 
数据的这个特征很适合于比作流体,虽然这种比拟与物理学家所定义的流体不是一回事,但却有如下的相似性:
 
              流体和数据都很容易从一个地方传输到另一个地方。
              流体和数据一样都很容易通过很长的管道传输。
              流体和数据都很容易装满容器,而不给其他的物体留有空间。
              一旦流体或数据流发现一条流入的路径,就很难挡住它的去路。
 
上面最后一点可能是最令系统管理员害怕的。一旦另一个系统的用户开始访问和存储数据,要想停止他的行为是很困难的。任何对这个问题持有异议的人,只要考虑一下系统管理员如何忙于限制We b 文件下载的数量及订阅内容的份数,就会明白他处于何种困境之中。这些下载和订阅不仅使网络性能下降,也使磁盘比以往任何时候都更快地被填满。
 
流体数据不仅在到达时产生潜在的问题,当目标不接收来自发送系统的数据时,也会出现问题。例如,一个分散的商业公司的经营是以库存和仓库容量为基础的,如果这些报告不能按期到达,则购买系统不能以最高效率运作。
 
1.     流体数据源的识别管理流体数据要从识别数据源开始,通常的流体数据源有:
 
              企业资源计划(E R P)系统,如S A P / R 3。
              分布式数据库系统。
              电子文档交换(E D I)系统。
              电子商务(E C)。
              供应连锁管理系统。
              软件发布。
              Internet文件传输。
              Internet订阅服务。
              e-mail和文件附件。
 
术语结构数据是对非结构的特定应用文件格式而言的,用以表示保存在数据库中的数据,而数据流则包括这两种类型。一般而言,由于结构数据流的源和目的容易识别和度量,所以更易于管理和控制。E R P和E D I是两个结构的数据流的实例,无论是发送者还是接收者,它都是极其重要的。
 
e - m a i l和I n t e r n e t文件传输是两个非结构的实例,两者都是随机的和不可预测的,也很难对它们进行单独控制和管理。
 
家庭和办公室的e - m a i l交换是非结构e - m a i l数据流的一个例子。一旦人们养成了习惯,无论数据是私人的还是公司的,所有数据类型都开始流动,因此,用公司的e - m a i l系统来达到私人目的便司空见惯。不同的公司有着不同的e - m a i l系统的管理策略,但很少有公司防止其雇员用这种方式发送e - m a i l,即使在技术上是可能做到的,为了不伤害雇员的士气,公司一般也不限制其雇员利用这种方式发送e - m a i l。
 
事实上,问题还不只是雇员在工作时用e - m a i l系统达到私人目的,它也对系统管理产生影响。系统管理员必须处理存储所有e - m a i l需要的资源,以及收发e - m a i l对系统性能的影响等现实问题。更为严重的,e - m a i l的多份拷贝也最终扩散到整个网络,并产生存储多份拷贝的问题。如果一个e - m a i l被发送给5 0人,那么将需要存储4 0~5 0份该e - m a i l拷贝。当e - m a i l被转发和拷贝到其他用户时,单个e - m a i l消息的存储量将以指数的形式增长。图1 - 2显示了单个e - m a i l消息是如何产生2 0 份拷贝的,这些拷贝都被保存下来。

I n t e r n e t订阅服务也会产生类似的结果,I n t e r n e t订阅服务发送各种更新的信息,从股票价格、新闻到天气预报,无所不包。信息驱动的结果之一是当人们希望某条信息时,他们就订阅它。订阅服务系统每天都给办公室工作人员发送许多则消息,这些消息都是他们认为有用的、重要的,甚至是风趣的。结果导致需要存储的私有数据量急增,同时,也使这些信息的计划管理非常困难。
 
软件发布是另一个数据流的源。熟悉I n t e r n e t软件发布的用户经常订阅各种软件服务,这些软件服务包括更新、发布软件信息、预先发布软件的测试版,甚至更严重的情况,这样,一个软件很快就有4、5个拷贝保存在磁盘上,大大消耗网络服务器的存储空间,同时,在这种环境下,计划适合的存储需求也十分困难。

 

0
相关文章