千家信息网

DISK OPERATION ERROR交换机级联单模光纤链路故障该怎么解决

发表于:2024-11-16 作者:千家信息网编辑
千家信息网最后更新 2024年11月16日,这篇文章将为大家详细讲解有关DISK OPERATION ERROR交换机级联单模光纤链路故障该怎么解决,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
千家信息网最后更新 2024年11月16日DISK OPERATION ERROR交换机级联单模光纤链路故障该怎么解决

这篇文章将为大家详细讲解有关DISK OPERATION ERROR交换机级联单模光纤链路故障该怎么解决,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

  1. 问题描述

两台IBM DS6800 分别放置在主中心机房和容灾机房,通过B5000 McData4400两个光纤交换机的级联,实现LVM的容灾.两个交换机之间通过单模光纤连接,两个机房的物理距离大致为3.5公里.

因为别的单位的施工导致了单模光纤的中断 ,通信公司修复故障后,单模光纤恢复连接,可能是光纤的连接节点增加或者接线质量的问题,光纤链路的损耗达到8.23DB.1公里的损耗大概是1DB.而容灾中心的单模模块是4KM,所以连接虽然是通的,但中间不断有连接故障,最终导致操作系统层报磁盘错误.

[@more@]

#errpt

DCB479971118230710 T H hdisk86DISK OPERATION ERROR

DCB479971118211010 T H hdisk86DISK OPERATION ERROR

DC73C03A1118143810 T S fscsi0SOFTWARE PROGRAM ERROR

DC73C03A1118143810 T S fscsi0SOFTWARE PROGRAM ERROR

D666A8C71118143810 T H fcs0ADAPTER ERROR

DC73C03A1118143810 T S fscsi0SOFTWARE PROGRAM ERROR

DC73C03A1118143810 T S fscsi0SOFTWARE PROGRAM ERROR

D666A8C71118143810 T H fcs0ADAPTER ERROR

D666A8C71118143710 T H fcs0ADAPTER ERROR

C62E1EB71118143610 P H hdisk86DISK OPERATION ERROR

……

如上,AIX不断的报错,差不多每一分钟都在报'DISK OPERATION ERROR'的错误.

#datapath query device

DEV#:2DEVICE NAME: vpath3TYPE: 1750500POLICY:Optimized

SERIAL: 68947310208

==========================================================================

Path#Adapter/Hard DiskStateModeSelectErrors

0fscsi0/hdisk86OPENNORMAL 2743907375193

1fscsi0/hdisk88OPENNORMAL00

2fscsi1/hdisk94OPENNORMAL 294658485810

3fscsi1/hdisk96OPENNORMAL00

我们可以看到,存储到主机的4个链路都是open/normal状态.errors在不断增加。

Hdisk86 是通过fcs0 设备连接的,所以先检查这个链路的情况

#lscfg -vl fcs0

Device Specific.(Z8)........20000000C98F0996

…...

Hardware Location Code......U5802.001.0080624-P1-C4-T1

  • 问题分析

  • 根据HBA卡的wwn(20000000C98F0996),我们确定了它连接的光纤交换机。这个交换机就是链路出现问题的那个;然后检查通过这个交换机连接IBM DS6800aix主机的磁盘都在报错。从而确定是这个链路恢复以后信号衰减多于以前导致了链路的连接出现传输不稳定的故障。

    1. 问题解决

    更换容灾中心的单模模块,由原来的4km更换为10km的单模模块,经过半小时的观察,OS层不再报'DISK OPERATION ERROR'的错误了,问题得到解决。

    单模光纤的连接的衰耗的范围为5-18,目前的这个链路的衰耗在正常的范围内,问题出在单模模块的选择上,容灾中心的单模模块是4KM的所以无法实现正常稳定的通讯,更换为10km,链路恢复了正常。

关于DISK OPERATION ERROR交换机级联单模光纤链路故障该怎么解决就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

0