IBM 服务器

广东服务器技术论坛(IBM、HP、DELL、联想)存储IBM存储(磁盘阵列)论坛 → IBM 存储故障分析


  共有6050人关注过本帖树形打印

主题:IBM 存储故障分析

帅哥哟,离线,有人找我吗?
tplayer
  1楼 个性首页 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:342 积分:3847 威望:0 精华:0 注册:2010-4-20 14:03:49
IBM 存储故障分析  发帖心情 Post By:2010-8-11 22:57:46

DS3000/4000/5000在Linux主机环境中Lun在两个控制器之间来回切换的故障分析
故障现象:

1.SM报逻辑盘不在最优路径“Logical Drive Not On Preferred Path”
2.发现部分LUN在两个控制器之间来回切换
3.在 MEL 里面,发现 两个控制器都在报“Mode Sel page 2C”或“Automatic logical drive transfer”,或者在做“diagnostics”
4.由于LUN不断的在来回切换,导致相关主机的访问非常缓慢。在极端情况下,可能会连SM客户端软件都无法连上控制器。

分析思路和解决方法:
如果LUN在两个控制器之间来回切换,而且两个控制器都在报“Mode Sel page 2C”或“Automatic logical drive transfer”,那么就不太可能是链路的问题。
1. 首先确认有没有Linux类型的主机访问
2. 如果有Linux主机,就要确认Host Type是否设置正确
Lunix有两种方式来实现路径冗余,要求的host type是不一样的:

RDAC 双通道软件(主流方式) ---> 要求Host Type必须设置成LNXCL(旧版微码)或者是LNXCLVMWARE(新版微码)。这两种host type的ADT/AVT是Disable
HBA Failover Driver       ---> 要求Host Type 必须设置成Linux。这种host type的ADT/AVT模式是Enable。

目前在Linux主机环境中Lun在两个控制器之间来回切换的主要原因,都是Linux主机用了RDAC软件,而SM里面的Host Type又被错误的设置成了“Linux”。由于“Linux”类型具有欺骗性,客户或BP往往会错误的在使用RDAC的情况下选择了“Linux”的Host Type。

解决的方法就是把host type改成LNXCL(旧版微码)或者是LNXCLVMWARE(新版微码)。如果不改host type,也可以运行“DisableAVT_Linux.script”脚本去Disable ADT/AVT,效果是一样的。脚本在微码或者SM软件的Zip包里面。

注意事项:
1. 无论是改host type还是运行脚本,都建议在停止相关主机访问的情况下进行。
2. 在AIX或者是Linux主机环境下,在mapping的时候,还必须把名为“Access Logical Drive”的mapping(lun 31)删除。
3. 在VMware ESX Server环境下,host type也必须选择LNXCL(旧版微码)或者是LNXCLVMWARE(新版微码)

支持(0中立(0反对(0单帖管理 | 引用 | 回复 回到顶部

返回版面帖子列表

IBM 存储故障分析








签名