嘘~ 正在从服务器偷取页面 . . .

交换机端口及常见问题定位(三)


Agenda
1,常用线缆及收发器
2,交换机端口类型
3,常用命令
4,常用诊断工具
5,光口不能UP故障
6,电口为半双工故障
7,端口UP/DOWN故障
8,端口err-disable故障
9,网络排障方法总结
10,Console Port介绍
11,Lenovo TOR 交换机家族

光口不能UP故障

故障描述:SW1和SW2之间是10G多模链路,中间经过2个ODF架,部署完成之后链路无法Up。

第一步:检查端口是否shutdown
[Quidway-XGigabitEthernet1/0/9]display this interface
GigabitEthernet1/0/9 current state : DOWN
-- 如果是Administratively DOWN,则属手工shutdown
Line protocol current state : DOWN

思科,华为交换机:
手工shutdown = Administratively DOWN
Lenovo ToR交换机:
手工shutdown = Disable

第二步:检查两端配置
[Quidway-XGigabitEthernet1/0/9]display this interface
XGigabitEthernet1/0/9 current state : DOWN
Line protocol current state : DOWN
Description:HUAWEI, Quidway Series,XGigabitEthernet1/0/9 Interface
Switch Port, PVID : 1, TPID : 8100(Hex), The Maximum Frame
Length is 9216
IP Sending Frames‘ Format is PKTFMT_ETHNT_2, Hardware address is 0000-0a88-15cd
Last physical up time : -
Last physical down time : 2015-07-28 18:46:50
Port Mode: COMMON FIBER Speed : 10000, Loopback: NONE //确认两边都是10000M
Duplex: FULL, Negotiation: DISABLE //10G端口只有强制状态

第三步:光模块检查
[Quidway]dis transceiver interface XGigabitEthernet 1/0/9 verbose
XGigabitEthernet1/0/9 transceiver information:
Common information:
Transceiver Type :10GBBASE_SR_SFP
Connector Type :LC
Wavelength(nm) :850 //850nm为多模光模块,现网光纤也是多模光纤
Transfer Distance(m) :80(50um),30(62.5um),300(OM3) //光模块对于不同光纤支持的距离的长度
Digital Diagnostic Monitoring :YES
Vendor Name :FINISAR CORP.
Vendor Part Number :FTLX8571D3BCL-HW
Ordering Name :
1)多模光纤可以与单模光模块配合短距离使用;
2)单模光纤只能用于单模光模块,不能够与多模光模块配合使用。
注:单模光纤一般为黄颜色,多模光纤一般为橘黄色。

第三步:光模块检查
检查光模块的接收光功率,以判断链路衰减是否可接受:
[Quidway]display transceiver interface XGigabitEthernet 1/0/9 verbose
Current Rx Power(dBM) :-4.46 //接收光功率为-4.46dbm,在接受光功率范围内
Default Rx Power High Threshold(dBM) :1.00 //默认接收光功率上限
Default Rx Power Low Threshold(dBM) :-20.00 //默认接收光功率下限
Current Tx Power(dBM) :-2.04
Default Tx Power High Threshold(dBM) :-1.00
Default Tx Power Low Threshold(dBM) :-6.00
User Set Rx Power High Threshold(dBM) :1.00 //用户设置接收光功率上限
User Set Rx Power Low Threshold(dBM) :-20.00 //用户设置接收光功率下限
User Set Tx Power High Threshold(dBM) :-1.00
User Set Tx Power Low Threshold(dBM) :-6.00

第四步:链路检查
多模光纤类型多样,因为色散的原因,光模块支持的传输距离与光纤的带宽模式有关,怀疑可能是光纤的类
型选择不合理导致链路无法Up。 10GE光模块在使用不同类型的光纤情况下支持的传输距离参见下表所示:

第五步:更换器件
● 可以使用该链路光纤将设备的两个端口对接,来判断这条链路是否正常 例如,对交换机端口使用的链
路物理环回
● 分别进行两端链路的排查。
● 仍不能解决问题的情况下,可以通过更换光模块及光纤来测试。
● 因为光模块的厂家众多,很多光模块实现方法多种多样,需要注意检查模块是否与交换机兼容
● 经过以上步骤如果还无法解决, 应及时联系更高级别技术支持

结论:
经确认三段光纤均为OM1类型,传输距离为33m,而经过2个ODF架后距离为65m,远大于33m,因此链路无法Up

电口为半双工故障

故障描述:
交换机电口两端对接,结果其中有一个端口为半双工。

[Quidway-Ethernet0/0/5]display this interface
Ethernet0/0/5 current state : UP
Line protocol current state : UP
Description:HUAWEI, Quidway Series, GigabitEthernet0/0/5 Interface
Switch Port,PVID : 1,The Maximum Frame Length is 1600
IP Sending Frames’ Format is PKTFMT_ETHNT_2, Hardware address is 0000-
0a88-15d5
Port Mode: COMMON COPPER
Speed : 100, Loopback: NONE
Duplex: HALF, Negotiation: ENABLE
Mdi : AUTO

第一步:两端端口配置检查
分别在设备两端执行命令查看接口的双工、速率、协商模式信息。

原因分析
出现该类型的情况大多是由于端口的配置错误导致的,自协商电口与强
制电口对接,自协商端口由于不能从对端接收到含有双工能力的信息,
因此将本端口协商成能够兼容最基本网络设备能力的半双工,出现这种
情况时会伴有端口出现错误报文、报文丢失的情况。
如果配置检查,确认无误,则进行第二步

第二步:链路检查
设备之间是通过双绞线连接,需要做如下检查:

端口UP/DOWN故障

故障描述:
交换机电口两端对接,端口不断发生UP/DOWN。
Apr 15 2013 03:46:14-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[46]:Interface
GigabitEthernet1/0/1 has turned into UP state.
Apr 15 2013 03:46:10-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[47]:Interface
GigabitEthernet1/0/1 has turned into DOWN state.
Apr 15 2013 03:45:35-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[48]:Interface
GigabitEthernet1/0/1 has turned into UP state.
Apr 15 2013 03:45:31-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[49]:Interface
GigabitEthernet1/0/1 has turned into DOWN state.
Apr 15 2013 03:42:10-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[50]:Interface
GigabitEthernet1/0/1 has turned into UP state.

第一步:排除人为
首先排除本端人为操作,确认没有人为因素造成端口UP/DOWN :
● 命令操作
● 配置更改
● 插拔网线等

第二步:配置和链路检查
● 如果是电口,可以检查网线连接是否正常
● 如果是光口,可以检查光纤光模块连接是否正常
● 如果条件允许,可以做一下重新拔插测试
● 如果条件允许,可以更换线缆进行测试
● 检查端口双工,速度匹配,流控制
● 确保端口配置下没有将端口shutdown的保护类的配置,例如风暴控制联动接口shutdown等功能

第三步:日志分析
通过查看端口的up/down日志信息,并做问题端口的up/down信息统计,判断信息是否有规律。

一般有如下四种现象:
现象1: 连接的端口一般在较短的一段时间内(60S)都有多组端口up/down的信息。
较为常见的原因:对端设备应该在重启。
现象2: 一组端口同时up/down。较为常见的原因:多个端口同时连接一台设备, 且对端产生主备倒换。
现象3: down -> up间隔时间无规律。较为常见的原因: 对端设备对端口存在操作导致。
现象4: 端口在不同时间产生了up/down,其间隔时间<=1s(闪断)。
排查方法:
对端口做交叉验证,来区分端口的up/down是跟随着本端端口还是对端端口。如果为本端端的问题,
可以在本端口做自环测试, 观察现象是否依然存在。分析日志中是否存在有MAC地址漂移或其它异常。
注意,做自环测试时需要去除端口上的所有业务VLAN,并应将设备从生产网络中移除。

第四步:结合对端设备分析
● 如果本端无法分析出原因,建议需要同时分析对端情况。
● 如果对端设备是服务器,检查是否有teaming或bonding等配置
● 如果对端设备也是交换机,检查是否有链路聚合,模式是否匹配
● 如果条件允许,更换对端设备进行交叉验证,确认问题是跟随着本端还是跟随对端

此外,针对接口频繁闪断情况,还可以通过配置进行抑制:
[Quidway-Ethernet0/0/5]carrier down-hold-time 1000
[Quidway-Ethernet0/0/5]carrier up-hold-time 1000

端口 err-disabled

通常情况下,如果交换机运转正常,其中端口一项显示为启用(enable)状态。但是如果交换机的软件检测到
端口的一些错误,端口将随即被关闭。也就是说,当交换机的操作系统检测到交换机端口发生些错误事件的
时候,交换机将自动关闭该端口。
当端口处于 err-disabled 状态,将没有任何流量从该端口被转发出去,也将不接收任何进站流量。从交换
机外观上看去,端口相对应的 LED 状态灯也将由正常的绿色变为暗黄色。同时使用查看端口状态的一些命
令,比如 show interfaces,也会看到端口是处于 err-disabled 状态的。
err-disabled 的两个作用的:
● 告诉管理员端口状态出错。
● 消除因某个端口的错误导致所有端口,或者整个模块功能的出错。
err-disabled 状态的起因:

  1. 双工不匹配
  2. 端口信道的错误配置
  3. 违反 BPDU 守护(BPDU Guard)特性
  4. 单向链路检测(UDLD)
  5. 检测到后期冲突
  6. 链路振荡.(link-flap)
  7. 违反某些安全策略
  8. 端口聚合协议(PAgP)的振荡
  9. 2层隧道协议(L2TP)守护(L2TP Guard).

解除err-disabled
err-disabled可通过在端口模式(config-if) #, shutdown—>no shutdown 解决

网络 trouble-shooting

总的方法:
1,融离法:比如,融离网络的上行部分或下行部分
2,排除法:比如,当发现一条链路不通时,可能是线缆也可能是模块,排除 100%确认无问题的部分
3,替换法:与排除法共用
4,对比法:比如,当相同的设备或应用在其它环境中正常,可进行对比
5,由简到繁法:比如,当整个网络不通时,可先从最基本入手,如物理链路是否通,另外也可从局部入手,
逐步扩展
6,数据分析法:利用日志 running-config, syslog,抓包信息等所提供的具体数据进行分析
7,理论分析法:深入研究有关设备及应用的相关技术资料, 尤其是第三方设备, 往往是细节决定了一切
8,模拟实验法:有条件搭建一个模拟环境,在实验环境中分析、找出故障原因

具体步骤:
1,记录故障现场,保存交换机的配置及日志
2,画出网络拓朴,尤其是遭遇 trouble 部分的网络部分拓朴
3,确定网络是基于 Layer 2 还是 Layer 3 实现
4,检查 running-config 及 syslog,看是否有明显错误或提示信息
5,检查物理链路是否 UP,光纤网络特别注意,链路指示灯亮,链
路是 UP,但并不一定链路通
6,在基于 Layer 2 的网络中,是否需要 STP,如果不需要, STP 是否被开闭。如果需要并起用了 STP,
是何种模式的 STP(STP/RSTP/PVST/MST),
7,所有交换机是否启用相同的 STP 模式,如 Cisco 设备启用了PVST+, BNT 交换机是否也相应启用了
PVST+或 PVRST+,并且手工把每个 VLAN 加入一独立的 STP 实例
8,查看每个交换机的 STP 状态, 在所有交换机上根桥是否同步
9,进一步看每条链路的状态(forwarding/blocking),因为即便是二层链路处于 UP 状态,但在 STP
中处于 blocking 状态的链路也是不能进行用户数据通信
10,看二层链路状态和 STP 状态是否处于稳定状态,而不是进行flapping
11,如果网络是三层结构,查看每个设备的路由表,看是否有到目的网段的路由,并且路由稳定,并考虑
出和进的方向是否相同
12,利用 PING,看是否能 PING 通,是否有丢包
13,利用相应的跟踪工具如 trace route/tracert,看数据包在哪里中断,在三层网络中尤为重要
14,用抓包软件如 Wireshark,分析数据包,看数据包中的内容;结合交换机的端口映射, 确定在出端
口是否把包发出、 在入端口是否接收到包


文章作者: kclouder
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 kclouder !
  目录