文章转自:戴尔易安信解决方案订阅号
一直在引领,悠久的创新历史艾美奖获得者;从未被超越,连续5年Gartner魔力象限领导者遥遥领先。戴尔科技分布式存储如何成为客户海量非结构化数据存储的首选?四大颠覆,逐一解读。
这两天,媒体纷纷发布了暑期定档的电影名单,其中动画电影有13部,面对即将开启的票房大战,大家普遍关注是:谁会成为下一个“哪吒”(《哪吒之魔童降世》)?
毕竟“哪吒”是中国影史票房前三中,唯一的动画电影。如今说到动画电影,我们首先想到的就是精良的制作画面,但这意味着制作期间,每天都会生成的海量非结构化数据。如何实现存储、归档、及管理就成为最大难题。
值得一提的是,“哪吒”电影的所有数字化特效和后期渲染剪辑,都是在戴尔易安信分布式文件存储Isilon上完成(Isilon存储系列的新一代产品更名为PowerScale)。
其实除了媒体制作公司,生命科学,能源等其它行业,都面临着海量非结构化数据增长的长期挑战,而分布式存储架构成为这方面的主力解决方案,这种架构因独特的设计思路,一直以颠覆者形象“横行”存储界,下面就以PowerScale为例,从四大方面的颠覆一一解说。
*PowerScale由英特尔®至强®处理器提供支持,该处理器采用软件定义的基础设施和敏捷云架构,为PowerScale提供了卓越的性能和效率,可加速要求严苛的文件工作负载,使企业发挥数据资本的价值,加速业务的数字转型。
颠覆一
扩容比新购便宜,而且越来越便宜
俗话说“买车容易养车难”,汽车保养或维修时,零部件的价格会远高于整车购买时核算下来的成本。同样的,对于存储设备而言,单TB扩容的成本往往会高于新购时的价格,甚至当扩容到一定容量时,即使新购一台同样容量的存储都比扩容要便宜。“零售”的价格肯定要高于“批发”,这是一种普遍存在的销售策略。
但是PowerScale却颠覆了这一“常规”,未来扩容不仅比新购便宜,而且会越来越便宜。
视频,图片,文档等非结构化数据有很强的生命周期特征,新文件往往访问频繁,然后逐渐降温,而PowerScale强大的自动分层技术,可以在单一集群中部署不同性能,不同容量的存储节点,从而应对不同热度文件对性能和容量的需求。
数据分层自动实现,整个过程不需人为干预,系统后台自动处理,简单高效,同时对业务系统完全透明。
如下图所示,我们大致可以把数据分成热数据,温数据,冷数据和用于归档保存的“冰数据”组成。
一期规划时,我们可以只考虑热数据或者热数据+温数据的容量,二期扩容时,热数据和温数据的容量一般不会发生太大变化,我们只需要购买冷数据需要的归档节点即可。
从单TB成本来说,PowerScale归档节点的成本要大大低于适合热数据和温数据的全闪节点或混合节点。三期扩容时,大量的冷数据都将变成长期归档的“冰数据”,我们只需要扩容一些更低成本的对象云存储即可,从而进一步降低扩容成本。
颠覆二
管理1PB数据和管理10TB数据一样
一般来说,数据量越大,管理越复杂。传统存储文件系统一般都有大小限制(如100TB),当数据量从几十TB增长到几百TB后,管理的复杂度也呈现指数级增长。十几台存储,多个文件系统,数据分布不均,热点分布不均,因为空间压力不断手工删除快照,这些问题不仅增加了管理难度,无形中也增加了系统运行的风险。
PowerScale同样打破了这一惯例,因为单一文件系统可达50-60PB容量,数据均衡分布在所有节点,扩容只需要几分钟就可以完成,所以管理1PB的数据和管理10TB的数据几乎一样简单。
PowerScale架构
管理复杂度对比
颠覆三
一台高IQ(智商)的存储
大多数文件存储都只是一个“铁盒子”,我们只知道存放了多少数据,却不清楚到底存放了哪些数据。
PowerScale的DataIQ软件再一次颠覆了大家对存储的古板印象。它不仅可以存储大量的非结构化数据,更可以清晰地展示这些文件的数量,类型,大小,最近访问时间等信息。并支持把数据从文件存储迁移到文件存储,从文件存储迁移到对象存储,或者从对象存储迁移到文件存储。
通过对存储数据的深入了解,我们可以制定更合理的自动分层策略,科学设计全闪,混合,归档和长期归档节点的容量,在保证性能和容量的前提下,尽可能优化成本。
DataIQ还提供了自动和手动标签功能,可以按项目或者部门进行分类,从而作为企业内部的计费依据,实现IT成本精细化管理。
如何从海量数据中快速搜索某个文件?这也是我们面临的一个严重挑战,DataIQ通过文件索引机制,可以在几秒钟完成PB级文件搜索,从而大幅度提升文件管理效率。
数字化时代,了解企业自身的数据结构对业务来说非常重要,这是充分利用好企业宝贵数据,把数据转换为效益的前提。对IT部门来说,相比只是模糊地告知文件占用的容量,通过提供清晰的文件构成,更可以为企业的业务发展提供建议,提升IT部门在企业中的重要性。
DataIQ管理界面示例
颠覆四
未来无忧,彻底消除数据迁移
存储产品的生命周期在5年左右,之后将慢慢从生产转为测试或容灾环境,然后逐步淘汰。而数据的生命周期可能长达数十年,因此客户每隔几年就需要把数据从老设备“迁移”至新存储。
数据迁移向来是一件耗时耗力,高风险的工作,即使采用同一品牌产品的底层复制技术,往往也需要设置大量的文件系统复制关系,并要求一个较长时间的停机窗口,从而对业务的正常运行造成影响。
PowerScale同样颠覆了这种老旧的数据迁移方式,一劳永逸地消除了“数据迁移”这项客户最头疼的工作。
PowerScale不仅支持不同类型的节点混合在同一个集群中,其未来无忧的设计理念也支持把新老节点放在同一集群,并有三代PowerScale节点运行在同一个集群中的实际案例。
数据通过集群后端网络逐步从老节点迁移到新节点,在整个搬迁过程中,业务没有任何感知。PowerScale的前端采用了负载均衡的冗余设计,数据迁移完成后,把老节点从集群中剔除即可,真正实现了在线数据自动迁移。
分享近期两个成功案例
案例一:最近在国家重点扶植的芯片行业,PowerScale接连赢下多个大单。以下是为某芯片设计客户部署的文件存储架构图:
案例二:随着居家办公的增长,虚拟桌面变成了许多企业最重要的系统。某制造业客户选择PowerScale混合集群成功对其2000个大型虚拟桌面进行改造。以下为实施架构图:
2000个Citrix虚拟桌面(VDI)文件存储架构
总之,能够实现以上四大方面的颠覆,源于PowerScale独特的设计思路和创新技术,即凭借性能随容量线性扩展的横向扩展架构;智能的自动分层技术;数据感知功能;以及消除数据迁移等,从而根本上颠覆了客户在传统文件存储购买、使用、及运维中的许多固有观念,它能以极低的总体拥有成本,简单的运维管理,高IQ的数据感知,未来无忧的架构延续性,成为客户海量非结构化数据存储的首选。
也正因此在Gartner公布的《2020年分布式文件系统和对象存储魔力象限》报告中,戴尔科技以突出的优势荣登榜首,而这也是自2016年该报告公布以来,戴尔连续第五年获得。
2020年分布式文件系统和对象存储魔力象限
尊敬的读者
618刚刚结束
你是不是也像小编一样
犹犹豫豫忘了添加购物车?
纠结半天错过最佳抢购时间?
没关系!
戴尔科技618返场活动
盛大开启
多款新品0元试用
特惠继续 只等你来
欢迎扫描下方二维码
速速参与活动
���������