存储 频道

雷涛:解析HDS AMS2000的控制器架构

  【IT168 专稿】中端存储可说是存储市场的中流砥柱,占据存储市场整体销量的半壁江山,且在存储市场整体销量的比例还在继续增长。我们所指的“中端”多根据国际厂商自身的定义标准去划分,实际上的国内市场大部分用户需求均可被中端系统覆盖。作为承接高端和低端的产品阶层,中端系统必须在容量、速率、功能和成本之间取得较好的平衡。中端市场也的确不乏一些标杆性的产品在这个领域叱诧风云,基于中端市场旺盛的需求和飞速扩张的市场规模,几乎所有厂商都把这个领域作为征战角逐的主要阵地。HDS在2008年度对中端产品线作出了较大规模的升级,IT168特采访日立数据系统有限公司的业务发展经理雷涛先生为大家解读HDS AMS2000的亮点和创新……

存储架构的演变

    IT168:在2008年的时候我们也知道一些厂商都对自己中端产品线做了升级换代。HDS也是在2008年对自己的AMS系列的中端产品做了一些比较重大的升级,其中有很多的技术创新和亮点,请雷涛先生给我们先介绍一下AMS2000?

    雷涛:事先给我的交流主题,我理解是怎么评估一个中端系统,然后通过这种系统评估的时候,从厂商的角度,也会谈一下我们在产品实现上有哪些创新的机制。

    现在市场上有很多的声音在衡量一个系统。比如说是不是采用了双核处理器,或者多核、四核技术,用什么主频技术实现中端处理器的性能,Cache容量是多大,是一个4G的存储,还是8G的存储,是FC的存储,还是未来FCoE的存储,是否有多协议的连接能力,种种类型都在描述存储本身。有些人谈是不是用更高等级的SSD,转速,FC传输协议等等一系列的内容都是围绕着存储本身来谈的。

    其实可以看到4G、8G应该是思科提出的,双核、四核的技术应该是英特尔和三星所能实现的,SSD同样有一些SSD的厂商实现,作为存储厂商,我们更应该考虑存储厂商的核心价值,到底是贡献给中端市场还有高端市场哪些革新和创新呢?事实上在关于存储本身还有是很多分类和设计特点的体现。

    回顾一下整个存储架构的演变,我本人也在存储行业工作了多年,从最早的控制卡技术,我们2000年给国内的电信运营商做IDC建设和C网、固网建设的时候,10-20TB的大型存储也是基于这种直连存储架构技术。之后出现了企业级存储平台和模块化存储平台两个分支。模块化存储平台的特点就是取代了主机与存储之间,他作为一个桥梁,承上启下,对所有的LUN,对所有的逻辑数据访问磁盘控制,将底层虚拟化,对上层进行控制。上层应用通过控制器的访问,就可以实现对底层磁盘箱的访问。为了更高端的应用机制,往往需要采用双活控制也就是两个处理器来保证对你的集中存储的高可用。当出现问题的时候可以通过上层的应用软件来做负载均衡。

    更高端一点,像目前主流的一些,我们电信用户,银行用户,还在使用企业级的分步式处理,为什么用分步式处理呢?因为你控制器前端很少,模块化前端数量是有限的,而你后端磁盘数量又是庞大的,当你需要处理海量规模的时候,就需要实现一个很平滑的扩展,分布式存储处理企业级高端应用往往将前后端做分步处理,前端芯片来单独负责所有的主机和来自网络的IO,后端芯片负责你后端的环境连接,以及磁盘的访问,前后端都用的交换的结构。像高端的存储系统,我们USP V,EMC等都是实现这种高端的架构,实现了高可用的形式,任何一个前端的访问,都可以访问到任何一个后端,这是跟模块化一个差异性的区别。从2000年至今一直是这么一个模式。

将高端控制器架构带入中端

    雷涛:HDS现在在新的2000系列产品当中做了什么样的创新呢?我们并不是将英特尔更高主频的CPU做了一个升级,也不是将更先进的存储介质拿到我们这里做了一个升级,我们是真正改变了一个存储本身的结构,在模块化存储采用了新的架构。我们原有的USP V采用的这种高端的三层分离的结构带到了中端系统,实现方式就是我们看到的双活的控制器技术。

    现在很多中端厂商都是双活处理器,每个控制器都再处理相应的IO,但是这种双活有对称双活和非对称双活的区别,我们举一个例子,你一个IO下来以后,是不是两个控制器可以同时参与对你IO的处理,我们把这样叫对称双活,多数情况还有市面上所有模块化处理,往往都是对控制权的访问,在某一个时刻,这个数据线只是属于某一个控制区,要想实现两边的负载均衡,就是用将任务A扔给A,将任务B扔给B,这种形式实现的。这种双活的特性,一个实现的访问,它的优势就是在于准高端的架构,它可以使用户获得哪些益处呢?首先它优化了性能,我们可以看这张片子,这个片的就是典型的双活,左边就是标准的非对称双活,每一个IO的处理都是在控制器内部实现的,当我需要切换的时候,切换对某一个数据卷的控制权的时候,我需要将整个session切换到另一个控制器,这是通过主机的负载均衡软件时间的。

    主机的负载均衡软件往往是需要一个IO的判定时间,它会有一个判断,比如说几十秒,因为左边一个处理断掉以后会重建另外一个处理,实现控制器对数据卷的访问,控制器在同一时刻只可能属于A或者只属于B。这样就耗费掉了大量的时间。

    那么这样的情况下,如果业务很繁重的话,就会涉及到一个问题,当你前端断口业务从控制器A的端口进来了,但是响应时间很慢,这个oracle数据库已经超过10m的响应时间了,我需要提高它的速度,控制器也恰好空闲,我是否能够借助控制器A的端口访问B的后端,在高端上这是可以实现的,因为中间有一个全交换架构,所有前端和后端都是全透明的,都是互相访问的,高端前后端分离,它可以良好的解决一部分前端的负载均衡,前端的如果反应时间长了,可以切换到它,它可以通过前端的链路来实现。

双活控制器消除后端瓶颈

    雷涛:后端也会涉及到负载均衡的问题,大家都会涉及到一个分盘的问题,哪个数据卷放在哪个磁盘上,当数据磁盘扩容以后,增加一些新的容量以后,它可能会成为一个热点,因为  频繁的数据库应用就在某一个固定的卷上,后端的瓶颈就会出现的,这时候多数情况下是靠厂商的PS来实现的,我们专业服务帮助你做数据摆放服务,把Oracle数据库分开,哪些应用放在哪些磁盘卷上。

    怎么去消除后端的瓶颈呢?实际上它更需要的是后端的负载均衡能力。因此将你原有的IO session,整个session 在A,或者整个session在B的情况下,我给它像高端一样分离开,我有前端的芯片,也有后端的芯片,任何一个前端可以访问任何一个后端,它没有控制器A和控制器B之间差异性,所以这就是AMS2000所带来的优势。

    它将两个控制器中间用高速互联访问的方式做了一个实现,同时它在每一个前端上可以拥有自己的路由表控制后端的芯片,当你控制器A出现访问的时候,用B参与A的作业,这是性能优化,同时带来一个部署的优化,不用考虑分端口,如果有几十个端口上来,不用分端口,我们可以负责你的负载均衡。尤其对于虚拟环境,VMWare虚拟环境,你一个HBA卡可能服务于很多虚拟机,这时候你作为用户而言,是无法自己去判断的,因此前端的负载均衡是至关重要的,对于后端而言也是,后端负载均衡可以消除你的系统瓶颈,在你系统不断变化和扩展的时候给你动态的均衡环境。因此这是简化了我们用户的一个部署,同时我们应用得到了优化,性能的优化。

    它还获得了一个可用性级别,向高端系统一样的可用性级别。当A出现繁忙问题的时候,传统情况下它可能需要负载均衡软件,驻留在主机端上的负载均衡软件,来做判断,几十秒的时间来切换到另一个控制器上,重建你的IO操作。当它繁忙的时候,可以在另外一个控制器实现,不需要主机端的负载均衡软件参与就可以实现。你在可用性级别上从几十秒降到秒级别。

    有一个极端的例子,我讲一下,比如说我们在做单链路情况下,比如说我们跟IPTV的电信用户做一些IPTV都是刀片服务器,都是单链路,还有像一些媒体行业,广电行业,它的编辑采集机都是单链路,单链路连在你的存储上,你给用户推销一个双控制器的存储,没有负载均衡的能力,意味着你事实上控制器是无法实现的,你只是通过业务的负载,业务的判断实现,我把业务A放在这儿,我把业务B放在这儿。

    我们再讲这个极端的例子,如果我们单链路情况下,比如说我们在做升级和扩展,我们在做控制器A的位码升级,在传统的领域里,控制器A的位码升级,对于用户而言必须配双控制器卡才能保证业务不停顿。我们看前端,如果这个session在做升级,你所有的前端和后端都是要停顿下来了,如果你只有一个单链路出去的,意味着你只能停机。对于我们而言,如果你做它的升级,它的前端依然可以通过芯片访问到另一段的后端。

    在极端环境下,用户只有一个HBA,它所做的升级依然可以保证业务的在线。这样所有的特性高端是具备的,但是所有的中端模块化的产品以前两个session情况下不可能实现的,这是我们讨论的双控。它可以实现三种优势,优化了你的性能,简化了你系统的部署,不需要我们专业的PS,专业服务的人员,那是每天要花1.2K美金,走到现场给你做性能调优的部署。而且对于一些虚拟化环境根本无从下手进行调优,它可以实现自动的双控。我们讲双控是采用了USPV类似的这种高端的三层架构实现的,将前端端口和后端端口分离来实现的对数据卷的访问工作。

更好的适应服务器虚拟化环境

    IT168:您刚才谈到一点,在虚拟化环境下前端的双活控制器自动负载均衡意义也是非常重要的。因为现在主机虚拟化确实对后端的产品环境提出了很多的挑战。

    雷涛:对,现在虚拟化走的越来越成熟了,比如说VMWare,它更多的成功案例都是集中在服务器端,比如说客服系统,还有前置的营业系统,这些X86平台。它怎么解决IO汇集以后对存储资源的访问控制呢?它前端的虚拟化做了一个容器,将你的内存和CPU资源包装提交给这个容器,同样需要对后端的磁盘和磁盘访问便利的虚拟化做一个对等,如果没有这个虚拟化,你前端虚拟化,后端又制订一个静态的链路。

    IT168:没有办法最大发挥你虚拟化的效用。

    雷涛:对,这也是为什么很难在一些关键的比如说计费应用上看到,像这些海量IO吞吐的情况下,传统的模式还是采用静态链路的方式来做IO处理的方式。

    刚才讲到三层分离架构以后,我们相信这个创新是在模块化产品推出以来很大的一个革新,因为它将高端的产品技术引进了模拟化产品,这比你放更高主频的CPU,更高容量的Cache,是引入了一些新的媒介进来放在存储里要好。

0
相关文章