机器学习辅助的多目标优化海底光缆路由规划研究《光通信技术》官网

引用本文：

赵赞善，高冠军，甘维明，等. 机器学习辅助的多目标优化海底光缆路由规划研究[J]. 光通信技术，2025，49（3）：10-15.

机器学习辅助的多目标优化海底光缆路由规划研究

赵赞善1,2,3，高冠军1*，甘维明2,3，王皓宇1，段茂生1，康达

（1.北京邮电大学电子工程学院，北京 100876；2.中国科学院声学研究所南海研究站，海口 570105； 3.陵水海洋信息海南省野外科学观测研究站，海南陵水 572423；4.哈尔滨工程大学水声工程学院，哈尔滨 150000）

摘要：为提升海底光缆路由规划算法的全局优化能力，降低累积成本与风险，同时提升算法效率，提出一种机器学习辅助（MLA）的多目标优化海底光缆路由规划算法。MLA利用强化学习优势，自主迭代学习，同步优化成本与风险，考虑海底地形、水深等参数，同时采用Pareto前沿面作为收敛评价标准，并与传统蚁群优化（ACO）算法进行对比验证。实验结果表明：在相同风险水平下，该算法能降低27.45%的铺设成本，其最优解累积风险仅为ACO算法的25%，且收敛速度提升了330倍以上。此外，其大部分Pareto解位于前沿面，明显优于ACO算法解集的离散分布。

关键词：海底光缆路由规划；多目标优化；强化学习；Q学习；海缆系统经济性优化；海缆系统生存性优化

中图分类号：TN91 文献标志码：A 文章编号：1002-5561（2025）03-0010-06

DOI:10.13921/j.cnki.issn1002-5561.2025.03.002

研究背景：

海底光缆是国际通信的重要基础设施，承载着全球约99%的国际通信业务。
海底光缆部署环境恶劣，成本高昂，且易受多种风险因素影响。
传统的路由规划方法耗时且难以同时优化成本和风险。

研究目的：

提出一种机器学习辅助（MLA）的海底光缆路由规划算法，以最小化累积成本和风险。

主要方法与创新点：

MLA框架：

构建与成本和风险目标相关的学习环境。
利用强化学习（特别是Q-learning）优化搜寻策略。
Agent通过与环境交互，不断学习最优策略。

先验数据初始化：

将成本和风险分布映射到Agent的动作空间（Q表）中。
考虑成本和风险因素，初始化状态-动作空间。

状态更新与奖励规则：

使用Q-learning的状态更新公式进行策略优化。
设计奖励规则，根据Agent动作的好坏反馈奖励。

算法及复杂度分析：

提出基于MLA的多目标优化海底光缆路由规划算法。
分析算法的时间复杂度和空间复杂度。

实验结果与讨论：

与传统蚁群优化（ACO）算法对比，MLA算法在相同风险下节省27.45%的成本。
MLA获得的累积成本最大的Pareto解的累积风险仅为ACO获得的最小成本Pareto解对应累积风险的四分之一。
MLA算法的时间效率比ACO提高330倍以上。
MLA算法的Pareto解几乎全部位于前沿面上，表明其全局优化能力更稳健。

结论：

MLA算法在海底光缆路由规划中展现出显著的优化性能、时间效率和收敛速度优势。
通过结合随机搜索与策略驱动，MLA避免了固定权重带来的局限性，实现了成本和风险的有效平衡。