引用本文:
赵赞善,高冠军,甘维明,等. 机器学习辅助的多目标优化海底光缆路由规划研究[J]. 光通信技术,2025,49(3):10-15.
赵赞善1,2,3,高冠军1*,甘维明2,3,王皓宇1,段茂生1,康 达
(1.北京邮电大学 电子工程学院,北京 100876;2.中国科学院声学研究所 南海研究站,海口 570105; 3.陵水海洋信息海南省野外科学观测研究站,海南 陵水 572423;4.哈尔滨工程大学 水声工程学院,哈尔滨 150000)
【下载PDF全文】 【下载Word】摘要:为提升海底光缆路由规划算法的全局优化能力,降低累积成本与风险,同时提升算法效率,提出一种机器学习辅助(MLA)的多目标优化海底光缆路由规划算法。MLA利用强化学习优势,自主迭代学习,同步优化成本与风险,考虑海底地形、水深等参数,同时采用Pareto前沿面作为收敛评价标准,并与传统蚁群优化(ACO)算法进行对比验证。实验结果表明:在相同风险水平下,该算法能降低27.45%的铺设成本,其最优解累积风险仅为ACO算法的25%,且收敛速度提升了330倍以上。此外,其大部分Pareto解位于前沿面,明显优于ACO算法解集的离散分布。
关键词:海底光缆路由规划;多目标优化;强化学习;Q学习;海缆系统经济性优化;海缆系统生存性优化
中图分类号:TN91 文献标志码:A 文章编号:1002-5561(2025)03-0010-06
DOI:10.13921/j.cnki.issn1002-5561.2025.03.002
研究背景:
海底光缆是国际通信的重要基础设施,承载着全球约99%的国际通信业务。
海底光缆部署环境恶劣,成本高昂,且易受多种风险因素影响。
传统的路由规划方法耗时且难以同时优化成本和风险。
研究目的:
提出一种机器学习辅助(MLA)的海底光缆路由规划算法,以最小化累积成本和风险。
主要方法与创新点:
MLA框架:
构建与成本和风险目标相关的学习环境。
利用强化学习(特别是Q-learning)优化搜寻策略。
Agent通过与环境交互,不断学习最优策略。
先验数据初始化:
将成本和风险分布映射到Agent的动作空间(Q表)中。
考虑成本和风险因素,初始化状态-动作空间。
状态更新与奖励规则:
使用Q-learning的状态更新公式进行策略优化。
设计奖励规则,根据Agent动作的好坏反馈奖励。
算法及复杂度分析:
提出基于MLA的多目标优化海底光缆路由规划算法。
分析算法的时间复杂度和空间复杂度。
实验结果与讨论:
与传统蚁群优化(ACO)算法对比,MLA算法在相同风险下节省27.45%的成本。
MLA获得的累积成本最大的Pareto解的累积风险仅为ACO获得的最小成本Pareto解对应累积风险的四分之一。
MLA算法的时间效率比ACO提高330倍以上。
MLA算法的Pareto解几乎全部位于前沿面上,表明其全局优化能力更稳健。
结论:
MLA算法在海底光缆路由规划中展现出显著的优化性能、时间效率和收敛速度优势。
通过结合随机搜索与策略驱动,MLA避免了固定权重带来的局限性,实现了成本和风险的有效平衡。