存储 频道

万国数据梁艳:数据中心运营难题与解决

  【IT168 专稿】随着云计算、大数据时代的来临,企业数据中心的规模越来越大,并且出于业务的需要,其数据中心的分布也越来越广,极有可能一个企业都会拥有多个数据中心。而这一现象带来的直接影响可能就是运营成本直线上升,并且可能由于管理方法不够完善,尽管成本上去,效率却未必能够上去,反而可能有所下降。那么这一问题该如何解决呢?来自万国数据全国数据中心交付运营总经理梁艳女士将给我们分享多数据中心运营的难题与解决之道。


万国数据全国数据中心交付运营总经理梁艳在IT168畅谈数据中心运营难题与解决之道

  “服务要学希尔顿 管理要学制造业”

  万国数据从2001年在深圳自建数据中心到现在已经发展了十余个年头,梁艳女士认为,在这十余年的发展历程中,万国数据的发展主要可分为三个阶段。首先从01年开始自建数据中心,致力于灾备外包服务。以后的几年,万国数据在在北京、上海、大连以及广州等地与合作伙伴一起共建数据中心,树立了万国数据在灾备服务领域的“金字招牌”。

  直到2007年,万国数据的第一个转型期开始到来。出于对万国数据在灾备服务方面取得的良好口碑,一些客户为了降低运营成本,同时也为了更好地保证业务,希望将IT托管给专业公司,于是一些客户开始与万国数据合作,尝试将生产中心托管给万国数据。出于新的业务需求,万国数据开始独立自建数据中心。

  截止到2012年,万国数据已经在全国各地运营了15个数据中心,构建了覆盖华北、华东、华南、西南等地辐射亚太地区的世界级数据中心网络。随着云时代的来临,出于万国数据本身业务和长远发展的考虑,万国数据开始进军云计算高地。自对外推出万国数据公有云服务以来,受到许多客户的好评。梁艳女士认为,这主要得益于万国数据十余年的数据中心运营检验,给用户提供了高SLA的服务。

  梁艳女士认为,万国数据的成功之道可以概括为两句话,即服务要学希尔顿酒店,而管理则要向制造业学习。如果理解呢?梁艳女士解释说,对于用户而言,你需要的是效率,如我的存储空间要从10个G升级为20G,你的开通时间是多少?并且随着容量的升级,你的计费系统是否能够随之变化。因为这些资源都是付费的,你必须要给用户提供一个类似电话详单的收费记录。

  而管理则要学制造业是因为,要对每一道工序,甚至每一个螺丝的拧法进行标准化,就如同丰田汽车的流水线一样。例如在万国数据的管理标准中,仅是上下电就有二十步。穿什么衣服,带什么工具,每一步由谁执行,以及注意事项都有明确的规定。每一步细节,甚至小到每一个标签,每一个动作,都是非常标准化。

  云计算将严重依赖企业运营能力。云是一种服务,不能仅仅停留在技术层面,更重要的是服务价值。从底层到基础层,到中间件层,以及云服务的上层,这是一个延续的完整的体系,缺少任何一层都不可以。梁艳女士认为,云服务的运营管理壁垒是很高的,除了需要一个可视化的快速自动部署平台之外,还需要一个非常强悍的商务平台,这二者的完美结合才有可能被用户市场所接受。

${PageNumber}

  多数据中心运营秘诀:集中化、标准化、自动化

  如果你懂技术,你就会运营数据中心吗?如果企业能管好一个数据中心,就能够管理好多个数据中心吗?梁艳认为,实际未必如此,多数据中心管理的难度,要远远大于单数据中心管理的难度。在管理多数据中心时,如果不用集中化管理的思路,标准化管理体系,以及自动化去将前二者落地的话,多数据中心管理将面临巨大挑战,否则必然使得各地分散数据中心管理风格与管理方式都不一样,并且其提供的服务也将会千差万别。

  据梁艳女士介绍,自其加入万国数据之后,她和她的团队都在致力于标准化、自动化和集中化的贯彻落实,这是针对多数据中心管理的唯一法宝。例如,目前万国数据在上海外高桥的数据中心为骨干数据中心,然后下面是个区域数据中心,主中心与区域中心形成互备关系。然后区域中心下面又有卫星级数据中心,卫星级数据中心并不配备监控系统,除了现场CCTV监控之外,整个监控系统都集中在区域中心。目前,万国数据已经成功将原来各数据中心各自监控自己的内容(如IT、CCTV以及风火等)集中到统一的主数据中心,并进行统一的监控和管理。

  同时,不同级别的数据中心之间又形成一个互备的关系,这样就形成集中化管理,并大大增强万国数据应对突发事件的能力。例如,就监控体系而言,主数据中心的统一监控平台可以看到所有数据中心的监控画面,一旦发现问题,就可马上派单到分散的数据中心进行处理。而主数据中心如果遭遇故障,一分钟之内没有响应,那么副中心就会立马接管,并立即向主数据中心汇报,这样就形成了完整的互备。据梁艳介绍,在万国数据的十六个数据中心内,每天要做的维护、演练和批处理作业,在一个大的调度中心作业里面全部可以显现出来,然后在调度中心直接向下派送就可以了。

  标准化管理是指整个运营管理体系都是一套统一的标准,然后下发各地严格执行。这样不只是万国数据提供的服务是标准化的,其数据中心的运营管理也是非常标准化的,如现场巡视SOP、存储SOP以及现场施工SOP,甚至小到一个功能较多表使用的过程都有严格的规定,这就是标准。只有这样,多个数据才会跟随调度中心的步调,而不会出现脱节,甚至调度中心无法掌控的局面。

  而要实现前面的集中化和标准化,梁艳女士认为,如果没有自动化工具是根本不可能实现的。自动化就监控自动化、流程自动化、报表自动化,因为我们要看大量的报表才能管理数据中心,最后就是资源管理的自动化。只有利用自动化工具才能将集中化和标准化管理植入到系统当中。这就如沃尔玛或者麦当劳到全国各地开店一样,梁艳女士说,其所有的运营管理体系、工具部署以及服务设计都是跟全国各地的店保持一致的。

${PageNumber}

  “降低运营成本需要创新突破性方式”

  随着企业业务的不断扩张,数据中心的规模也日益扩大,随之增长的是运营成本,效率反而下降。据埃森哲的一份报告显示,随着规模的不断扩大,拥有优秀运营能力的组织其运营成本的比例日趋下降,而创新方面的投入比例则随之增长,只有这样,IT才能不断驱动业务的增长。梁艳女士认为,要达到这一效果,必须要使用创新的、突破性的技术手段,仅仅在传统方式上进行成本节省,只是治标不治本的做法。

  怎样创新呢?梁艳女士解释说,比如企业原来是用的大型机或小型机,如果能够用大量的刀片服务器来替换原来的应用。她进一步解释说,她曾经做过相关的测试,用一组刀片来实现整个性能的达成,可能会远远高于小型机的性能,而成本仅是其五分之一。当然,这种方式会有一定的风险,梁艳女士说,她并不是提倡所有的企业都用刀片来替换替换大型机或小型机,而是,如果企业需要降低运营成本,就必须采用革命性的技术,来真正降低运营成本。

  实际上,包括英特尔在内的硬件设备供应商已经越来越意识到数据中心运营成本的难题。比如在英特尔在最新发布的E5平台,就提供了一些数据中心辅助工具,比如说其能够检测到主机的温度、功耗以及频率等等。而从包括戴尔在内的主流服务器供应商发布的最新的产品亦可看出,他们也大大加强了服务器内部的温度、功耗以及功耗监控之外,还提供了诸如服务器发现等等功能。

  梁艳女士认为,新服务器的这些新的功能或者功能改进能够有效地帮助企业用户更好更方便地管理数据中心。服务器厂商的这种变化,往数据中心靠的情况,对数据中心运营商来说,是一个好消息。并且,梁艳女士说,互相开放接口,互相往外延展,整个管理才能更加完善,互相渗透,互相完善,这将有利于整个生态链的健康发展。

0
相关文章