引用本文:

王蕴,林霄,楼芝兰,等. 面向边缘光算力网络的上行链路资源协同调度算法[J]. 光通信技术,2024,48(3):45-51.

面向边缘光算力网络的上行链路资源协同调度算法

王 蕴1,林 霄1*,楼芝兰2,李 军3,孙卫强4

(1.福州大学 物理与信息工程学院,福州 350116;2.浙江财经大学 数据科学学院,杭州 310018;3.苏州大学 江苏省新型光纤技术与通信网络工程研究中心, 江苏 苏州 215006;4.上海交通大学 区域光纤通信网与新型光通信系统国家重点实验室,上海200240)

【下载PDF全文】 【下载Word】

摘要:为满足冷、热业务实时、高效的算力调度需求,提出一种基于自适应噪声完全集合经验模态分解(CEEMDAN)与时间卷积网络(TCN)的算力负载预测模型(简称C-TCN模型),并设计了基于C-TCN与Q学习的资源协同调度算法(CTQ算法),利用C-TCN模型提前感知下一时刻负载变化,通过Q学习协同调度波长与存储资源,寻找最佳波长划分与边缘存储分配方案。实验结果表明:CTQ算法的调度性能不仅优于现有调度算法,能满足冷、热业务调度性能要求,而且还能提高波长利用率。

关键词:边缘光算力网络;算力调度;数据传输;资源调度;网络优化

中图分类号:TN91  文献标志码:文章编号:1002-5561(2024)03-0045-07

DOI:10.13921/j.cnki.issn1002-5561.2024.03.009

0 引言

  近年来,大语言模型、生成式人工智能(AI)等新一代AI技术快速发展,取得了诸多令人瞩目的成果[1]。AI技术的蓬勃发展致使海量亟待训练与推理的数据在网络边缘侧产生[2]。然而,终端设备、边缘节点通常计算资源有限,无法满足AI“最后一千米”的算力需求[3]。为此,国家六部门联合印发文件[4]明确提出促进边缘算力协同部署,强化算力接入网络能力,通过调度各区域节点之间的计算资源,满足日益增长的边缘算力需求。与电网中电力调度不同,算力无法在物理维度被调度至用户。因此,算力调度的核心是通过网络将用户数据传输至目标节点进行计算。光网络因其高带宽、低时延、高可靠性及确定性等特点[5],使其成为边缘算力网络的承载网,即边缘光算力网络(EO-CPN),为算力调度提供高效且可靠的传输通道。然而,EO-CPN效能的发挥取决于其根据算力业务特点,对光网络资源进行高效调度的能力。

  现有的调度算法主要研究静态网络场景,即业务到达网络情况提前给定或者已知,并将网络资源调度问题建模为静态优化问题[6-8]。在实际网络中,算力业务到达情况是时变的,因此现有静态优化调度算法难以满足算力业务的实时调度需求。此外,算力业务通常可分为冷业务和热业务两大类[9]。其中,热业务以在线游戏、AI推理等为代表,这类业务对传输延迟的要求较高,因此需要立即调度资源以满足其算力需求;而冷业务则以大数据分析、AI模型训练等为代表,这类业务在遭遇网络拥塞或计算高峰时,可容忍一定延迟,因此可以通过延迟调度来“错峰”满足算力需求。然而,大部分现有调度算法只研究单一类型业务,缺乏对算力业务冷热属性的区分,难以高效利用宝贵的网络资源[6-8]。其原因为:一方面,若所有业务按照高峰期流量需求进行网络资源配置,可能导致资源利用率低下、算力业务调度成本过高;另一方面,若所有业务均按冷业务要求调度,将造成网络资源配置不足,导致大量热业务将因长时间等待有限资源而无法及时调度,最终造成阻塞。文献[10]考虑了边缘计算中同时存在的延时敏感型与延时容忍型任务,并设计了资源划分、抢占和缓存机制,这些机制协同满足2种类型边缘计算任务的调度需求。然而,多种调度机制的引入使得调度问题复杂度高,而传统优化算法求解过程复杂,因此难以实现实时调度。

  本文将自适应噪声完全集合经验模态分解(CEEMDAN)与时间卷积网络模型(TCN)相结合,提出一种算力负载预测模型(下文简称C-TCN模型),以准确预测下一时刻算力负载的动态变化。在此基础上,设计基于C-TCN与Q学习的资源协同调度算法(下文简称CTQ算法),满足冷热业务调度性能要求的同时提高资源利用效率。


5 结束语

  为了满足EO-CPN中冷、热业务的实时算力调度需求,本文首先将CEEMDAN与TCN模型结合,提出了C-TCN模型,用于预测下一时刻算力负载变化。在此基础上,本文将Q学习与C-TCN模型结合,提出了CTQ算法,该算法能够提前感知下一时刻负载变化,预先对波长资源划分与边缘存储资源分配进行协同调度。实验表明,C-TCN模型的预测精度高于现有预测模型。此外,CTQ算法在Bhot、Bcold、Phot、U等方面表现出色,不仅优于传统的固定分配算法,还与Optimal算法所获得的最优方案最为接近,同时其调度复杂度远低于Optimal算法。因此,CTQ算法能够满足算力业务的实时调度需求。