存储 频道

警惕SCSI设备冲突,“内置”“外插”有讲究

    IT168编辑:针对存储人的工作经验和生活感受,IT168“我的存储人生”征文活动正在热烈进行中。回首我们曾经走过的沧海桑田,留下了太多的令人回味的东西,赶紧提笔写下最令你难忘的存储人生感受,与同仁网友们分享。详情请看:IT168我的存储人生征文活动启事

    【IT168 征文专稿】我跨入存储行业的门槛时间不长,但是在这段短短的时间里,经历了无数的第一次。最让我难忘的实施经验是入行后第一次为客户上门实施。那天Boss突然告诉我要去山东出差给用户解决问题,要知道在那以前,我还从来没独立上门给用户服务过,因此一路上心里不停的打着小鼓,就担心自己露怯。

用户报修,超市业务大受影响

    刚到客户那里,就被客户的网管员小刘一把拽进了机房。原来,客户是当地一家较有规模的外资连锁超市,一直依赖这套后台系统进行买卖记账和结算。某天早上,业务人员突然说终端结账系统无法使用,小刘发现是服务器端数据库无法访问,于是被迫启用一套备用服务器支撑业务。

    但是备用服务器性能远远不能满足数据频繁读取的负荷需求,在超市业务最繁忙的时候,也是服务器当机重起最频繁的时候,而且新产生的数据都需要财务加班,手工输入到原有的系统中才能完成当日和当月的结算。所有的业务人员都对小刘怨声载道,连一向和蔼可亲的经理这两天一见到小刘脸色就阴沉下来。

    听过了小刘的诉苦,我详细察看了用户的环境。超市使用了2台IA架构的服务器挂接一台SCSI的磁盘阵列做双机系统。主机采用Windows2000 advanced server操作系统,使用一套超市专用的帐务系统,后台是SQLServer2000。

    两台服务器采用了Windows系统自带的MSCS工作在Active-Passive的主从模式下工作,MSCS检测、管理、切换双机的资源组,以保证SQL服务一直能正常运行。由于超市营业时间较长,服务器白天从8:30开业后一直处于运行状态,提供所有数据库等软件服务,对数据进行存取;晚上20:00客户端关闭,停止服务请求;22:00利用SQL内置的管理工具对主机数据进行备份,把服务器上的数据备份到磁盘上。

    当数据库不可访问的故障发生后,小刘先启动了一套备用的服务器作为帐务系统,然后查看主机的事件查看器,发现主机和备机都有ID2、5、14的报错,时间为前一天晚上22:01(开始备份的时间)。网管员重新启动磁盘阵列,数据库又可被重新访问了。本来小刘把业务系统切换回来以为没事了,但是第二天发生同样的故障,重启磁盘阵列后,数据库又可重新被访问。随后连续的几天内都发生同样的故障。

    经过初步判断,我认为问题应该出在数据连接上,于是采用排除法,先后更换服务器到阵列的内外部线缆、SCSI终结器、磁盘阵列控制器以及整套磁盘阵列,但是问题仍然存在,最后改用了外插SCSI卡,状况良好。我总算可以回北京跟Boss交差了。

0
相关文章