引用本文:

王亚男,杨雪,庄浩涛,等. 基于强化学习的资源最优化逻辑拓扑映射算法[J]. 光通信技术,2020,44(6):46-50.

基于强化学习的资源最优化逻辑拓扑映射算法

王亚男1,杨 雪2,庄浩涛3,朱 敏2,康 乐2,赵永利3

(1.中国电力科学研究院有限公司,北京 100192;2.国网四川省电力公司,成都 610041; 3.北京邮电大学 信息光子学与光通信国家重点实验室,北京 100110)

【下载PDF全文】 【下载Word】

摘要:光传送网(OTN)中光节点波长复用/解复用器以及光开关矩阵可实现任意结构的逻辑拓扑在物理拓扑上的映射,不合理的映射方案将消耗额外端口资源。提出一种基于强化学习(RL)的逻辑拓扑最优化映射算法,将预处理后的拓扑状态和逻辑通道数据用于训练RL模型,以对逻辑通道进行全局波长资源分配,最终达到资源最优化目的。仿真结果表明:所提算法有效减小逻辑拓扑映射过程中的资源消耗,从而最小化网络部署成本。

关键词:光传送网;逻辑拓扑映射;强化学习;网络资源分配

中图分类号:TN915 文献标志码:文章编号:1002-5561(2020)06-0046-05

DOI:10.13921/j.cnki.issn1002-5561.2020.06.011

0 引言
    光传送网(OTN)具有带宽容量大、交换能力强等优点,是下一代骨干网络的主要基础设施。从信号承载的角度,OTN体系架构可分为光层和电层。其中,光层是基于波长选择开关(WSS)的业务疏导体系,支持多方向、多速率的波长级颗粒的疏导;电层是基于光通路数据单元交换机制(ODUk Switch)的多向性电层疏导体系,支持ODU0/1/2/3多颗粒疏导,通过电层交叉实现子波长调度,解决波长冲突、传输限制和跨域互联等问题[1]。
   OTN可利用波长复用/解复用器以及波长路由技术(OMS)实现任意结构的逻辑拓扑在物理拓扑上的映射[2]。其电交换结构支持更细粒度的电层逻辑通道,即光层的一个波长可复用多条电层通道,从而提高频谱利用效率;当需要电处理时,同一波长上的所有逻辑通道也可以被解复用。与同步数字体系(SDH)分层网相比,OTN能显著提高网络功能虚拟化(NFV)、物联网等高带宽应用的适应性和传输效率。其中,NFV最大的挑战之一是如何以最小代价且最高效率将虚拟网络拓扑(逻辑拓扑)映射到物理网络抽象出的拓扑上[3]。所谓物理拓扑是OTN光节点的物理连接关系,即光节点与光缆链路的集合,因而物理拓扑一般不随业务改变而改变。逻辑拓扑指的是节点之间业务的分布情况,由一系列端到端的光通道构成的拓扑结构,即在物理拓扑基础上负责分层路由的光层逻辑结构[2]。
    在逻辑拓扑映射过程中,为了实现光/电转换,必须在交换结构上分配一个或多个光/电(O/E)端口(下文简称为端口),以便在光域和电域间转换信号。不合理的逻辑通道映射将消耗额外的端口,这将大大增加运营商的成本。优化的逻辑拓扑映射方案是解决OTN网络资源消耗最小化问题的关键。资源消耗主要表现在波长资源分配时新端口的引入,从而导致部署成本的增加。目前,虚拟网络映射问题已得到了广泛的研究[5-8],但针对OTN逻辑拓扑映射过程资源优化问题的研究还很少。文献[9]提出了基于拓扑排序的修正算法,但未将所涉及的网络拓扑状态作为网络资源最优化的影响因素;文献[10]利用最小k-cut问题形式设计了2种启发式算法,用于智能平衡电层资源和频谱资源使用率以达到资源消耗最小化目标,但未从网络状态出发考虑全局最优化。因此,为了综合考虑有限波长资源、端口数等条件对逻辑拓扑资源分配限制的问题,本文提出一种基于强化学习(RL)的逻辑拓扑最优化映射算法,以降低OTN中拓扑映射过程中额外端口引起的成本。

4 结束语
    为了减少OTN中逻辑拓扑映射过程额外端口的数量,本文提出了一种经济高效的逻辑拓扑智能化映射算法。仿真结果显示:与常规启发式算法(KSP+FF)相比,本文算法能够根据全局网络环境特性做出更好的映射决策,以避免额外端口的引入。本文拓扑映射算法中通道资源分配采用RL算法,而逻辑通道算路过程采用KSP算法,并未完全实现逻辑拓扑映射过程的智能化。后续工作将着重研究基于RL的算路与资源分配算法,实现逻辑拓扑映射过程的完全智能化。