引用本文:

赵赞善,高冠军,甘维明,等. 机器学习辅助的多目标优化海底光缆路由规划研究[J]. 光通信技术,2025,49(3):10-15.

机器学习辅助的多目标优化海底光缆路由规划研究

赵赞善1,2,3,高冠军1*,甘维明2,3,王皓宇1,段茂生1,康 达

(1.北京邮电大学 电子工程学院,北京 100876;2.中国科学院声学研究所 南海研究站,海口 570105; 3.陵水海洋信息海南省野外科学观测研究站,海南 陵水 572423;4.哈尔滨工程大学 水声工程学院,哈尔滨 150000)

【下载PDF全文】 【下载Word】

摘要:为提升海底光缆路由规划算法的全局优化能力,降低累积成本与风险,同时提升算法效率,提出一种机器学习辅助(MLA)的多目标优化海底光缆路由规划算法。MLA利用强化学习优势,自主迭代学习,同步优化成本与风险,考虑海底地形、水深等参数,同时采用Pareto前沿面作为收敛评价标准,并与传统蚁群优化(ACO)算法进行对比验证。实验结果表明:在相同风险水平下,该算法能降低27.45%的铺设成本,其最优解累积风险仅为ACO算法的25%,且收敛速度提升了330倍以上。此外,其大部分Pareto解位于前沿面,明显优于ACO算法解集的离散分布。

关键词:海底光缆路由规划;多目标优化;强化学习;Q学习;海缆系统经济性优化;海缆系统生存性优化

中图分类号:TN91  文献标志码:文章编号:1002-5561(2025)03-0010-06

DOI:10.13921/j.cnki.issn1002-5561.2025.03.002

研究背景

  • 海底光缆是国际通信的重要基础设施,承载着全球约99%的国际通信业务。

  • 海底光缆部署环境恶劣,成本高昂,且易受多种风险因素影响。

  • 传统的路由规划方法耗时且难以同时优化成本和风险。

研究目的

  • 提出一种机器学习辅助(MLA)的海底光缆路由规划算法,以最小化累积成本和风险。

主要方法与创新点

  1. MLA框架

    • 构建与成本和风险目标相关的学习环境。

    • 利用强化学习(特别是Q-learning)优化搜寻策略。

    • Agent通过与环境交互,不断学习最优策略。

  2. 先验数据初始化

    • 将成本和风险分布映射到Agent的动作空间(Q表)中。

    • 考虑成本和风险因素,初始化状态-动作空间。

  3. 状态更新与奖励规则

    • 使用Q-learning的状态更新公式进行策略优化。

    • 设计奖励规则,根据Agent动作的好坏反馈奖励。

  4. 算法及复杂度分析

    • 提出基于MLA的多目标优化海底光缆路由规划算法。

    • 分析算法的时间复杂度和空间复杂度。

实验结果与讨论

  • 与传统蚁群优化(ACO)算法对比,MLA算法在相同风险下节省27.45%的成本。

  • MLA获得的累积成本最大的Pareto解的累积风险仅为ACO获得的最小成本Pareto解对应累积风险的四分之一。

  • MLA算法的时间效率比ACO提高330倍以上。

  • MLA算法的Pareto解几乎全部位于前沿面上,表明其全局优化能力更稳健。

结论

  • MLA算法在海底光缆路由规划中展现出显著的优化性能、时间效率和收敛速度优势。

  • 通过结合随机搜索与策略驱动,MLA避免了固定权重带来的局限性,实现了成本和风险的有效平衡。