引用本文:

侯磊:应用于光传输设备的增强型告警抑制方法[J]. 光通信技术,2019,43(1):59-62.

应用于光传输设备的增强型告警抑制方法

侯 磊

(上海欣诺通信技术股份有限公司,上海 201613)

【下载PDF全文】 【下载Word】

摘要:随着光传输网结构的复杂性和灵活度的增加,每台光传输设备的软硬件模块都可能发生故障。现有告警抑制的实现没有考虑保护状态的变化,导致应该过滤的告警未被屏蔽,或应该显示的告警却被过滤了。提出一种应用于光传输设备的增强型告警抑制方法,能根据保护配置和倒换状态信息来更换关系模型,重新分析告警相关性,更高效地发现故障根源,为光传输设备提供更有效的维护手段和方法。解决在告警抑制运算中保护倒换状态的变化导致告警上报的监测点不同,而影响告警相关性分析结果准确性的问题,并给出相关实验证明。

关键词:OTN;告警;增强型;保护倒换

中图分类号:TN915.41  文献标志码:文章编号:1002-5561(2019)01-0059-04

DOI:10.13921/j.cnki.issn1002-5561.2019.01.014

0 引言
       光传输设备一般指波分复用、光同步数字传输网、分组传送网和光传输网等设备,广泛应用于接入网、城域网和骨干传送网。光传输设备在光层采用波分复用技术,在电层采用映射、复用和交叉等技术,使得传输网可以灵活高效地传输各种业务颗粒度的数据流[1]。光传输设备不仅能支持丰富的开销管理协议,可以实现同时对业务端到端和多个分段的性能监视,而且还能提供灵活的基于电层和光层的业务保护功能,如基于光通路数据单元层的光子网连接保护和共享环网保护、基于电层的子网连接保护、通道保护和复用段保护等。随着光传输网结构复杂性和灵活度的增加,每台光传输设备发生故障的概率也随之加大。
       按照协议规定,一个故障通常会在设备上产生大量的告警,比如说一个网元设备故障可能会产生一个网元告警、多个板卡告警以及该板卡上所有端口和所有业务上报告警,而作为真正故障原因的网元设备告警就会淹没在这些告警中。为了能快速有效地分析海量告警,更快地发现故障根源,通常会对告警进行抑制运算[2]。告警处理模块根据告警关系模型确定每个告警的优先级,上报告警时用高优先级的告警抑制低优先级的告警,即可以有效地对告警结果进行过滤。但是,现有的告警抑制方法[3]中有的完全不考虑保护状态的变化,有的通过在最终告警信息上增加一个业务来源点来标示告警所在业务,都忽视了保护状态变化导致的告警上报监测点不同,这会对告警相关性分析产生影响[4],可能出现应该过滤的告警未被屏蔽,或者应该显示的告警却被过滤掉的情况[5]。为解决以上问题,本文提供一种应用于光传输设备的增强型告警抑制方法,该方法根据保护倒换状态来准确地抑制告警,能有效减少告警抑制处理时间和记录告警状态占用的内存空间。

4 结束语
      本文根据业务保护倒换状态动态地更新告警关系模型,解决了在告警抑制运算中由于保护倒换状态的变化导致告警上报的监测点不同,影响告警相关性分析结果准确性的问题,进而实现在告警抑制上使业务保护倒换状态对用户透明,让用户可以更快更准确地发现故障根源,提高告警处理效率的效果。按照业务模型将告警分层,告警抑制运算从根节点顺序处理,只要发现存在高层告警,就不再继续算下面的底层告警,提高了遍历的效率。同时,使用比特位文件记录系统的实际物理告警,文件里每个比特位都代表某个告警的状态,在进行告警抑制运算时先将比特位扩展成字节参与布尔运算,在运算结束后将运算结果压缩成比特位再存储回去,这样可以大大减少记录告警状态需要的内存空间。本文通过理论分析,模拟实际应用场景进行测试,证明了应用于光传输设备的增强型告警抑制方法的可行性及优势。