存储 频道

NetApp 性能调优:如何不加磁盘提高性能

  【IT168 专稿】Tech OnTap 的读者可能大多都知道,存储系统的随机读取性能在很大程度上取决于硬盘数(存储系统中的硬盘总数)和硬盘转速(单位 RPM)。但是,为提高性能而增加硬盘就意味着需要更多的功耗、散热及空间;而且,伴随着硬盘容量增加速度快于其性能表现的提升,很多应用程序可能为了获得非常好的性能而要求增加磁盘轴,即便它们并不需要如此大的容量。

  在开发性能提高模块(Performance Acceleration Module,简称 PAM)时,NetApp 的目标就是突破随机读取性能和轴数之间的联系,使得存储系统能在提供更高级别性能的同时减少对功耗、散热和空间的需求。衡量性能的其中一个重要方面是延迟时间或响应时间,亦即满足指定读取请求的时间。对于 PAM 而言,NetApp 将其目标定为在高 CPU 负荷 (80%) 的情况下,缩短一个数量级的平均读取延迟。我们首次发布的产品成功实现了这一目标。在内部测试过程中,我们还发现 PAM 能使 Microsoft® Exchange、VMware®、文件服务及 Perforce 等多种常用应用程序显著提速。

本文将深入探讨 PAM,其中包括:
  PAM 软硬件概述
  读取缓存策略
  使用预测缓存统计 (PCS) 功能确定能否受益于 PAM(无需购买模块)

什么是 PAM?

  简而言之,性能提高模块就是二级缓存:用于存放从 WAFL® 缓冲区高速缓存中退出的块。(WAFL 即 NetApp® 的“任意位置写入文件布局”,用于定义 NetApp 如何在磁盘上排列数据。WAFL 缓冲区高速缓存是系统内存中由 WAFL 维护的读取缓存。)在没有 PAM 的系统中,每次尝试读取系统内存中并不存在的数据时都会造成磁盘读取。配备 PAM 后,存储系统在发出磁盘读取前,会先检查请求的读取是否已缓存到其安装的任一模块中。Data ONTAP® 在系统内存中保留了一组缓存标记,因此它无需访问模块也可确定是否有块驻留在 PAM 中。由于在命中缓存时只需进行一次 DMA 操作,因此,这种能力可有效缩短访问延迟。与任何缓存一样,成功的关键在于“决定什么数据可进入缓存”的算法。我们接下来将详细探讨此问题。

  性能提高模块可加快从各类工作中读取数据的速度,但它其实最适合具有大量小规模随机读取(例如消息传送、基于文件的应用程序、主目录)的工作。磁盘驱动器很难应付此类工作,因为在传输数据之外,它们还需要耗费大量时间去寻找指向正确位置的驱动器机头。

图 1) 是否使用 PAM 进行随机读取的对比。

  PAM 是由硬件和软件组合而成的(PAM 软件称为 FlexScale)。要启用硬件必须具备许可。PAM 硬件模块的长度是 PCIe 卡的四分之三,每个模块可对 16GB 的 DDR2 内存进行双通道 DMA 访问,模块上含有一个自定义编码的现场可编程门阵列 (FPGA),它可提供加速缓存任务所需的板载智能功能。表 1 中列出了各款存储系统所支持的最大模块数目。

  强大的恢复能力是 PAM 的设计宗旨之一。由于该模块可充当缓存使用,因此可直接丢弃不可纠正的错误以利于磁盘读取。如果模块中的不可纠正错误率超过设定的阈值,模块将自动禁用,且系统将恢复为未缓存操作,不会中断服务或要求重启。在此过程中,ECC 将用于检测误码,而数据 CRC 则保护从 CPU 到卡内存再到 CPU 的端对端数据传送。

  一旦出现模块禁用情况,系统就会显示错误消息并指出需要换出的问题模块。如果启用了 NetApp AutoSupport,系统还会向 NetApp 传送消息,以便我们采取纠正措施(具体视服务协议的期限而定)。

0
相关文章