加好友 发短信
等级:超级版主
帖子:342
积分:3847
威望:0
精华:0
注册:2010-4-20 14:03:49
|
IBM 存储故障分析 Post By:2010-8-11 22:57:46
DS3000/4000/5000在Linux主机环境中Lun在两个控制器之间来回切换的故障分析 故障现象:
1.SM报逻辑盘不在最优路径“Logical Drive Not On Preferred Path” 2.发现部分LUN在两个控制器之间来回切换 3.在 MEL 里面,发现 两个控制器都在报“Mode Sel page 2C”或“Automatic logical drive transfer”,或者在做“diagnostics” 4.由于LUN不断的在来回切换,导致相关主机的访问非常缓慢。在极端情况下,可能会连SM客户端软件都无法连上控制器。
分析思路和解决方法: 如果LUN在两个控制器之间来回切换,而且两个控制器都在报“Mode Sel page 2C”或“Automatic logical drive transfer”,那么就不太可能是链路的问题。 1. 首先确认有没有Linux类型的主机访问 2. 如果有Linux主机,就要确认Host Type是否设置正确 Lunix有两种方式来实现路径冗余,要求的host type是不一样的:
RDAC 双通道软件(主流方式) ---> 要求Host Type必须设置成LNXCL(旧版微码)或者是LNXCLVMWARE(新版微码)。这两种host type的ADT/AVT是Disable HBA Failover Driver ---> 要求Host Type 必须设置成Linux。这种host type的ADT/AVT模式是Enable。
目前在Linux主机环境中Lun在两个控制器之间来回切换的主要原因,都是Linux主机用了RDAC软件,而SM里面的Host Type又被错误的设置成了“Linux”。由于“Linux”类型具有欺骗性,客户或BP往往会错误的在使用RDAC的情况下选择了“Linux”的Host Type。
解决的方法就是把host type改成LNXCL(旧版微码)或者是LNXCLVMWARE(新版微码)。如果不改host type,也可以运行“DisableAVT_Linux.script”脚本去Disable ADT/AVT,效果是一样的。脚本在微码或者SM软件的Zip包里面。
注意事项: 1. 无论是改host type还是运行脚本,都建议在停止相关主机访问的情况下进行。 2. 在AIX或者是Linux主机环境下,在mapping的时候,还必须把名为“Access Logical Drive”的mapping(lun 31)删除。 3. 在VMware ESX Server环境下,host type也必须选择LNXCL(旧版微码)或者是LNXCLVMWARE(新版微码) |
|
|