以文本方式查看主题

-  广东服务器技术论坛(IBM、HP、DELL、联想)  (http://gzhuize.com/bbs/index.asp)
--  IBM存储(磁盘阵列)论坛  (http://gzhuize.com/bbs/list.asp?boardid=8)
----  IBM 存储故障分析  (http://gzhuize.com/bbs/dispbbs.asp?boardid=8&id=937)

--  作者:tplayer
--  发布时间:2010-8-11 22:57:46
--  IBM 存储故障分析
DS3000/4000/5000在Linux主机环境中Lun在两个控制器之间来回切换的故障分析
故障现象:

1.SM报逻辑盘不在最优路径“Logical Drive Not On Preferred Path”
2.发现部分LUN在两个控制器之间来回切换
3.在 MEL 里面,发现 两个控制器都在报“Mode Sel page 2C”或“Automatic logical drive transfer”,或者在做“diagnostics”
4.由于LUN不断的在来回切换,导致相关主机的访问非常缓慢。在极端情况下,可能会连SM客户端软件都无法连上控制器。

分析思路和解决方法:
如果LUN在两个控制器之间来回切换,而且两个控制器都在报“Mode Sel page 2C”或“Automatic logical drive transfer”,那么就不太可能是链路的问题。
1. 首先确认有没有Linux类型的主机访问
2. 如果有Linux主机,就要确认Host Type是否设置正确
Lunix有两种方式来实现路径冗余,要求的host type是不一样的:

RDAC 双通道软件(主流方式) ---> 要求Host Type必须设置成LNXCL(旧版微码)或者是LNXCLVMWARE(新版微码)。这两种host type的ADT/AVT是Disable
HBA Failover Driver       ---> 要求Host Type 必须设置成Linux。这种host type的ADT/AVT模式是Enable。

目前在Linux主机环境中Lun在两个控制器之间来回切换的主要原因,都是Linux主机用了RDAC软件,而SM里面的Host Type又被错误的设置成了“Linux”。由于“Linux”类型具有欺骗性,客户或BP往往会错误的在使用RDAC的情况下选择了“Linux”的Host Type。

解决的方法就是把host type改成LNXCL(旧版微码)或者是LNXCLVMWARE(新版微码)。如果不改host type,也可以运行“DisableAVT_Linux.script”脚本去Disable ADT/AVT,效果是一样的。脚本在微码或者SM软件的Zip包里面。

注意事项:
1. 无论是改host type还是运行脚本,都建议在停止相关主机访问的情况下进行。
2. 在AIX或者是Linux主机环境下,在mapping的时候,还必须把名为“Access Logical Drive”的mapping(lun 31)删除。
3. 在VMware ESX Server环境下,host type也必须选择LNXCL(旧版微码)或者是LNXCLVMWARE(新版微码)