存储 频道

不破不立 Facebook独立可升级子系统梦

  【IT168 资讯】当你的公司规模如Facebook一般,你就可以向供应商决定你的服务器采购条款了。一年半前,社交网络巨头Facebook做了一件出了名而无私的事情,就是开放了它第一个数据中心和服务器的硬件规格。从此,开放计算项目(Open Compute Project)启动了。

  Facebook的举动着实让一级服务器制造商吓坏了,现在Open Compute开始把目标对准了庞大僵化的服务器设计。

  前不久Open Compute Project在圣克拉拉举行的峰会上,有1900名服务器和数据中心专业人士参加并亲眼目睹了Facebook及其合作伙伴的计划蓝图。Facebook将贡献两款新的服务器设计,并讨论到了一款作为Facebook图片应用后端的新存储架构,Open Compute Project的其他成员也谈到了他们采用或者修改、贡献给开放计算联盟的服务器和机架设计。

  但是最大的新闻是Facebook硬件设计及供应链副总裁、Open Compute Project主席Frank Frankovsky所谓的“要打破庞大僵化的系统设计”。这意味着要分拆服务器、机架和数据中心的组件,这样就可以修改服务器、机架或者数据中心内的子系统以适用于某些特定的软件需求,而不是为了符合某些芯片制造商的路线图。

  Frankovsky解释说:“如今硬件设计中的最大挑战,是试图如何软件的发展方向。软件可能变得非常快,遗憾的是,在物理环境中我们无法只敲击几下键盘就更改了硬件。我们不得不计划材料、做设计、使用工具、带动制造和供应链的运作。”

  “因此在软件和硬件配置的变化速度之间,存在着相互阻抗的不匹配性。从传统上说,我们的服务器设计一直是庞大且僵化的。所有东西都绑定到一个PCB上,封装在一个金属壳子下,不具备让软件匹配硬件的灵活性。”


Facebook硬件副总裁、Open Compute Project主席Frank Frankovsky

  试图预测软件在数据中心的最终方向“会让你发疯”,Facebook并不认为虚拟化一定是提高硬件利用率的非常好的方法。在某些情况下,根据具体的工作负载要求,能够动态改变硬件组件也许是一个更好的答案。

  Facebook和Open Compute Project中的终端用户客户伙伴希望得到的,是Frankovsky所谓的“更智能的技术升级”。你不用只是为了做一次处理器、内存或者I/O的升级而非得更改整个系统。

  当然,这是与Intel、AMD和IBM等厂商在过去几十年中所做的大量集成工作是反其道而行之的。现在处理器有多个核心用于计算、浮点和十进制数据单位、多层缓存内存,至强E5芯片推出后,还有了片上PCIe控制器。不久,网络接口将迁移到处理器上,在ARM服务器处理器的很多情况下,还要添加整个交换机。

  这不是Facebook希望的。事实上,这是完全相反的,所以这将是很有趣的,看看Open Compute Project是否能够真的做出一个真正分离的系统。

  系统组件的模块化,要比制造整个系统的成本更高,这一点是毫无疑问的,但是Facebook想要争论的是,一个优化设计系统的其他组件会有更长的使用期限,从而降低了这些成本。最后,最终,芯片和其他组件的数据量减少,这一点对于Open Compute Project来说是很重要的。

  按照Frankovsky的解释,重要的是,模块化的服务器和机架设计将让企业加快硬件创新的速度,更好地调优硬件以满足软件需求。

  首先,你不必等到处理器、内存和I/O技术都齐备了用到新的服务器中。其次,如果你犯了一个错误,没有向系统中添加足够的容量,你是可以修改的。或者,如果你添加了太多,还可以拿出来用于其他有软件需要的硬件。

  在一定程度上,通过记忆棒、硬盘和CPU已经可以做到这一点,但这些都是交织在一起的。而这正是芯片制造商和系统制造商乐于看到的,因为对于任何一种技术的需要,都将迫使你不得不同时升级所有这些组件。换句话说,他们会赚更多的钱。

  Frankovsky在他的主题演讲中表示,2012年5月的OCP峰会上所发布的Open Rack设计,是这个分离化过程的第一个步骤,它打破了从无线电时代就开始使用的19英寸宽的机架设计标准,放宽到21英寸,使其更适合于容纳大容量低成本的3.5英寸硬盘。

  通过这种方式,在一台服务器前端你就可以有五个这样的机架,以及三个半宽的服务器节点。Open Rack还把电源从服务器中分离出来,放在机架中的三个电源架上,可以被机架中不同的计算、存储和网络节点共享。

  下一步就是所谓的“Group Hug”,这是一种新的标准背板,内部连接基于PCIe x8插槽的微服务器。这些Group Hug插槽看上去很像SeaMicro x86和Calxeda ARM微服务器处理器卡,他们都有一个相同的架构。不同的是,Facebook背板设计是每一台服务器都有一个PCI引脚, Calxeda和SeaMicro是每台服务器有两个引脚。


Group Hug微服务器背板,来自Open Compute

  Facebook看到了刀片服务器没有实现标准化,所以决定了微服务器规格和背板互连的设计。上面的图片中,有五个基于X-Gene 64位ARM服务器处理器的微服务器排成一条线,五个基于英特尔“Avoton”Atom S系列芯片的微处理器在另一边的插槽中,所有这些都共享相同的电源和机械互连,而且都能插到同一个微处理器机箱。

  与我们许多人一样,Frankovsky也为在服务器主板中缺乏插槽兼容性而感到苦恼,Group Hug背板是目前Facebook在微处理器中促进兼容性所能做到最好的一步了。但是Frankovsky还是表达了他的无奈。

  “在多年的服务器产品设计中,没有通用的插槽,这一点始终能逼得我发疯。为什么厂商不得不设计两个完全不同的产品线,一个针对英特尔的插槽,一个针对AMD的插槽。为什么要重复投资?除此之外的一切都是相同的,你仍然有DDR3内存,你仍然有网络控制器和驱动器控制器。”


英特尔贡献给Open Compute的机架中硅光子互连技术

  英特尔将自己的硅光子互连设计和连接器规范贡献给Open Compute Project,希望这些光管连接将被用于在机架中或者机架之间连接计算、存储和网络组件。

  英特尔和其他一些芯片制造商一直在研究硅光子,据英特尔首席技术官Justin Rattner表示,十几年间英特尔克服了制造硅光子的技术问题,使其能够被用于系统中。

  与Frankovsky一样,Rattner表示,英特尔也相信机架精简的想法,尽可能减少设备中的组件并整合电源。

  现在我们正身处的第二个分离阶段,是分布式I/O,以及分离交换、存储和来自系统的其他I/O(具有讽刺意味的是,在ARM服务器芯片中,这些正在被带入芯片中,没有被分离)。Rattner表示,下个阶段将是把计算和内存分离开,但是用高速低延迟的光学互连技术连接起来。

  当然现在我们还做不到这一点,但是英特尔已经开始这方面的工作了。

0
相关文章