存储 频道

IBM中端DS4000/DS5000维护指南-基础篇

  【IT168 专稿】在2008年IBM DS5000系列推出之前,DS4000系列一直充当着IBM的中端主力阵营,并拥有良好的市场业绩,在中端市场上打出了一片江山。IBM DS5000系列是IBM 2009年推出的中端产品线,随着DS5000的销售规模逐步扩大,原有的中端存储阵列DS4000系列正逐步退市。不过在用户环境中,DS4000系列仍然使用范围较广,因此本文将重点介绍IBM DS5000及DS4000系统在配置维护过程中需要注意的一些要点。

  本文的内容包括:IBM新旧中端产品的型号对比,如何观察DS4000/DS5000 各个部件的指示灯,DS4000/DS5000正确的开关机步骤,以及造成客户的存储数据访问中断的最主要的几种外部原因。

  新旧产品的型号对比

  DS4000 系列原本叫 FAStT 系列,IBM 在 2004 年将其更名成 DS4000 系列。新旧名称对应关系如下:

新旧产品的型号对比

  旧的 FAStT200和 FAStT500 因为在更名时已经停产,所以没有重命名; 新的 DS4200、DS4700、DS4800、DS5000 因为是在更名之后才推出市场的,因此没有所对应的 FAStT 型号。

  DS5000是 2008 年发布的,在市场定位上是 DS4800的后继产品。按照缓存和扩展能力的区别,有两个型号:DS5100(1818-51A)和 DS5300(1818-53A),DS5000的起始微码版本是 07.30.21.00。

  区分DS4300基本型号及Turbo型号

  注意:如何区分 DS4300基本型号和 Turbo 型号?

  两者的型号都是 1722-60U,但是可以查看 Profile 里面,每个控制器的 Cache 缓存大小来确认。

  DS4300 基本型号的每个控制器是 256MB Cache,因此在 Profile 里面显示每个控制器的缓存是 128MB,另外 128MB划给控制器内部操作系统使用。

  Cache/processor size (MB): 128/128;微码在 06.23以上的显示格式为:

  Cache
  Total data cache: 128 MB
  Processor cache: 128 MB

  DS4300Turbo 型号的每个控制器是 1GB Cache, 因此在 Profile里面显示每个控制器的缓存是864MB,另外 160MB 划给控制器内部操作系统使用;

  Cache/processor size (MB): 864/160,微码在 06.23以上的显示格式为:

  Cache
  Total data cache: 864 MB
  Processor cache: 160 MB

  DS4300 基本型号的控制器的 FRU 是 24P8206;DS4300 Turbo 型号的控制器的 FRU

  是 24P8225。两个备件是互相不替代的,因此要注意,不能搞错。

  观察DS4000/DS5000 各个部件的指示灯

  DS4000/DS5000 系列中不同的产品型号,状态灯和故障灯的位置都不同。请查阅参阅对应型号的官方白皮书“安装、用户与维护指南(Installation, User’s and Maintenance Guide)”中的(安装、用户与维护指南)的“Operating the storage subsystem”章的“Checking the LEDs”节。

  注意:在新一代的控制器和扩展柜上,多了一个显示状态和错误代码的两位数字 LED,要特别注意观察和对比文档。在正常情况下,该两位数字显示的是本柜子的 Enclosure ID。对于基本柜,默认的 Enclosure ID是“85”(除非人为更改) ;对于 EXP420/EXP810 扩展柜,默认的 Enclosure ID是由基本柜自动分配的,由 00开始。一般请不要去人为变更。

  掌握DS4000/DS5000的正确开关机步骤

  DS4000/DS5000 系列不需要运行命令进行开关机,只须关闭控制 2 个电源模块的电源开关就可以了。 注意整个主机和存储环境的开关机顺序如下:

  开机:SAN 光纤交换机(如果有的话)-->DS4000/DS5000 的 EXP磁盘扩展柜(如果有的话)?-->DS4000/DS5000 的控制器-->主机

  特别注意在开完所有扩展柜之后在开控制器之前要等待几分钟,等待所有硬盘完成初始化后,才开控制器。

  关机:主机-->DS4000/DS5000 的控制器-->DS4000/DS5000的EXP磁盘扩展柜(如果有的话) -->SAN光纤交换机(如果有的话)

  DS5000机头的关机细节和DS4000是不一样的:

  关闭两个电源的开关-->控制器缓存(Cache)中的数据自动备份到控制器内部的闪存(USB Flash)中,控制器的LED 交错的显示“os”和“bb”-->控制器电源在数据备份完成后才会关闭

  因为这个差异,DS5000的关机过程耗时比较长,大概5-10分钟(控制器的LED会交错的显示“os”和“bb”),关机后,控制器的代码和电源灯会熄灭。

  在DS5000按下电源按钮关机后,在控制器代码和所有电源灯熄灭前绝对不能进行任何操作!!!

  DS4000/DS5000 系统的开关机顺序非常重要。不正确的开关机顺序可能会导致部分硬盘离线以及数据无法访问。 如果因为不恰当的开关机导致系统无法正常运行,建议你马上收集一份All Support Data,然后立即联系 IBM 寻求帮助。

  强烈不建议在出现故障问题之后,再尝试按照正确的顺序去开关机一遍。这个操作可能会把问题搞得更糟。

  造成客户存储数据访问中断的原因

  经验表明,造成客户的存储数据访问中断的外部原因主要有以下几种:

  1. 存储内部错误的开关机顺序。例如先关扩展柜再关机头;或者先开了机头再开扩展柜;或者是最后一个扩展柜加电后,没有等足够的时间就开了机头。关于此错误我们在后面的文章中还会详细解释。

  2. 机头或扩展柜的速率开关处于错误的位置;或者是被在线拨动过。具体在后面的文章中还会详细解释。

  3. 在没有参考任何 IBM 官方服务文档的情况下,不规范的对存储进行了硬盘或扩展柜升级。例如在不做任何准备工作的情况下,直接添加硬盘和扩展柜,或者在不同的系统之间随意交换硬盘。

  4. 在没有参考任何 IBM 官方服务文档或微码说明文件的情况下,不规范的对存储系统进行微码的升级,甚至降级。

  5. 对存储子系统进行“Reset Configuration”等破坏性操作。在后面的文章中会进一步解释

  6. 在没有参考任何 IBM 官方服务文档的情况下,对处于故障状态的存储进行了一些不规范的修复操作。

  7. 在进行所有维护操作之前,没有收集 ASD并提前检查所有的相关隐患,导致在维护过程中触发了相关的隐患。

  8. 存储系统没有冗余的配置方案。例如每台主机只有一条光纤连接存储;或者机头和扩展柜之间只安装了一条光纤等等

0
相关文章