存储 频道

大量数据碎片——企业数字化路上的绊脚石

  【IT168 编译】数字化转型时代已经来临,它正在以前所未有的速度改变着商业格局。笔者看到许多研究表明,数字化的公司利润更高,在各自的市场上占有更大的份额。精通数字化的企业往往能够保持市场领先地位,而那些无法做到这一点的企业将难以生存——许多人将会被淘汰。

  这就是为什么数字化转型现在是每个企业和IT领导者的首要任务。ZK Research最近的一项研究发现,高达89%的组织目前至少有一项数字化方案正在进行中,这显示出了所有行业垂直领域对数字化的兴趣水平。

  数字化的成功在于数据的质量

  成为数字化公司的关键,在于是否能够从当今企业拥有的海量数据中找到关键的洞见。这一过程需要由机器学习驱动的数据分析,对这一主题,想必大家已经有了广泛的关注。

  另一半就是数据。单靠机器学习并不能解决任何问题,它需要分析数据,正如我们所说,好的数据带来好的见解,坏的数据带来坏的见解。

Photo by energepic.com from Pexels

  大量的数据碎片阻碍了数字化创新

  对于大多数企业来说,数据并不是不是驱动数字化转型的燃料——甚至可能会由于大量数据碎片(MDF,Mass Data Fragmentation)而成为最大的障碍。大量数据碎片表示当前的数据散落得到处都是,以及非结构化而导致的不完整的数据视图。由于数据竖井的存在,数据被打破为碎片。

  更糟糕的是,大多数公司可能都会有相同数据的多个副本。一些数据管理人员告表示,他们大约三分之二的二级存储是由副本组成的,但没有人知道哪些副本需要保存,或哪些需要删除,这就使他们必须保留所有数据。如果说坏的数据带来坏的见解,那么碎片化的数据将带来碎片化的洞见,这可能会对业务决策造成不好的影响。

  Amazon和谷歌等原生代互联网公司都是以数据为中心的,并对其基础设施进行了架构优化,以避免MDF问题。这就是为什么它们的业务是敏捷的、灵活的,并且似乎总是处于市场转型的最前沿。他们能够接触到更多高质量的数据,并且能够获得其他公司无法获得的洞察。

  产生大量数据碎片的原因

  大多数公司诞生于这样一个时代:数据不是一种用来提供竞争力的资产,更像是一场不可避免的“噩梦”。对于大多数公司来说,仅仅提到数据,就会让人联想到昂贵的存储系统、无效备份、复杂的管理问题以及可能削弱公司的风险。

  要解决MDF问题,重要的是了解其源头,以下是造成MDF的主要因素。

  ·数据爆炸。数据继续以指数级的速度增长,目前所有生成的数据中,有90%都是在过去五年中产生的,视频、物联网、信息和云技术只会加剧这一问题。

  ·大部分数据是非结构化的。大多数组织拥有的数据比他们所知道的要多得多,一般存储管理员都会知道有多少数据保存在集中存储系统上,但这只是现有数据的一小部分。企业可能有无数GB的信息存储在几十个或数百个位置的临时存储系统中,此外还有云服务,包括企业认可的公服务,以及员工使用的数百种消费者级服务。这种情况下,IT不再具有保护、控制和使用所有数据的能力。

  ·数据“暗箱”。即使IT管理者真的知道他们所有的数据在哪里,也不太可能知道其中的内容。包括诸如个人身份信息、所有者是谁、最后一次访问它的时间以及访问者是谁等信息。数据本质上是一个黑洞,因此管理和满足日益严格的合规性需求几乎成为了不可能的任务。

  ·二级存储占主导地位。通常,一个组织80%的数据都落在二级存储中。这包括存储在备份、归档、文件共享、对象存储、数据仓库和公有云中的数据。二级存储主要用于不经常使用的场景,而不是积极地为公司的整体数据集做出贡献。这意味着在二级存储中捕获的任何洞察都可能永远不会被发现。

  ·数据由遗留基础设施管理。IT行业目前正处于前所未有的创新时期,容器、闪存、云、移动互联和软件定义的基础设施使基础设施高度敏捷,并使其与数字化趋势保持一致。然而,在过去30年的大部分时间里,二级存储一直停滞不前。大多数组织使用竖井式和过时的产品组合,这些产品是为特定功能(如备份或文件共享)而设计的。

  大量数据碎片是一个非常严重的问题,它正在削弱组织在数字时代的竞争能力。现在是存储行业进行重大转变的时候——并不是一些渐进式的改进,而是对管理数据的全面反思,去解决与MDF相关的许多问题,这需要一种新的数据管理方法。

  原文作者:Zeus Kerravala

  原文链接:https://www.networkworld.com/article/3316979/understanding-mass-data-fragmentation.html

0
相关文章