引用本文:

马凝芳,田照宇,钱升起,等. 基于时延容忍度及报警反馈评估的故障业务恢复算法[J]. 光通信技术,2021,45(10):58-62.

基于时延容忍度及报警反馈评估的故障业务恢复算法

马凝芳1,田照宇2,钱升起2,邓春雪2,孙雨潇2,赵星宇2,马嘉瞬3,包博文3

(1.中国信息通信研究院 泰尔实验室,北京 100191;2.国家电网有限公司 信息通信分公司,北京 100761; 3.北京邮电大学 信息光子学与光通信国家重点实验室,北京 100876)

【下载PDF全文】 【下载Word】

摘要:为提高光网络的生存性,提出一种基于业务时延容忍度及报警反馈评估的故障业务恢复算法。首先,应用基于混合进化神经网络的链路多故障定位模型,从大量报警信息中准确定位故障位置;然后,对故障业务进行时延容忍度评估,并以此为依据为故障业务排列恢复顺序。此外,根据各链路上报警信息的种类和数量,对每条链路进行了可靠性评估,优先选择可靠性更高的链路进行路由。仿真结果表明:该算法的故障定位准确率高达91%,故障业务相对恢复时延度平均降低了48.83%,恢复路径可靠性平均提高了6.05%。

关键词:故障业务恢复;故障定位;报警反馈;时延容忍度;链路可靠性;混合进化神经网络

中图分类号:TN914 文献标志码:文章编号:1002-5561(2021)10-0058-05

DOI:10.13921/j.cnki.issn1002-5561.2021.10.013

0 引言
     随着光网络流量负载的持续增加,光网络一旦出现故障就可能导致数百个业务中断,严重危害光网络的生存性。当多个故障同时发生时,由于网络拓扑的连通性,一条链路的故障可能触发多条链路报警,从而导致业务的目标节点无法确定故障链路的具体位置。此外,不同的故障组合可能触发网络发出相同的报警信息组合,并且由于冗余报警数量众多,报警与故障之间的关系不是一一对应的,而是一种非线性映射关系,这大大增加了故障定位的难度;同时,随着5G时代的到来,用户对网络服务质量(QoS)的要求也越来越高。当网络发生链路故障并导致部分业务被迫中断时,这些故障业务的QoS会急剧下降。由于故障业务恢复需要一定的时间,且不同业务的时延敏感性强弱也不同,为了尽量满足用户对业务基本QoS的需求,以时延容忍度区分的业务恢复模式成为了刚需。此外,若故障业务恢复后再次遭遇网络故障而被迫中断,这不仅会使第一次的恢复工作完全失效,还会造成时延的叠加,严重降低了业务QoS。因此,如何选择一条可靠性更高的路径是故障业务恢复工作中至关重要的一环,亟需一种能够快速、准确地定位故障位置,又能进行高质量的故障业务恢复的算法。
   目前,基于深度神经网络(DNN)的故障定位算法[1]严重依赖于梯度,容易陷入局部最优解,难以进一步提高准确率。文献[2]提出了一种具有进化策略的混合进化人工神经网络(HEANN),该网络具备不受梯度约束的全局搜索能力,能够更精准地解决譬如光网络多故障定位的模式分类问题。但是,目前有关光网络故障的恢复算法大多是从网络角度出发的[3-4],并未考虑业务的恢复质量(如恢复时延和可靠性等)。因此,本文提出基于时延容忍度及报警反馈评估的故障业务恢复算法。

3 结束语
     本文提出了一种基于业务时延容忍度及报警反馈评估的故障业务恢复算法,该算法首先应用基于混合进化神经网络的链路多故障定位模型进行故障定位,并将定位结果应用到业务恢复中,然后将故障业务的时延敏感性以及基于报警反馈的链路可靠性评估结果作为故障业务恢复工作中的2项重要依据,在业务恢复时优先恢复时延敏感性更强的业务并优先选择可靠性更高的链路,最后采取首次命中算法分配频谱资源。仿真结果表明:该算法的故障定位准确
率高达91%,故障业务相对恢复时延度平均降低48.83%,恢复路径可靠性平均提高6.05%。该算法既降低了整体故障业务的恢复时延,又提高了恢复路径的可靠性,能够有效地平衡故障业务的整体时延并避免业务出现二次故障,在时延和可靠性两方面极大地提高了故障业务的恢复质量,对维护光网络的生存性具有重要意义。