引用本文:
李伟松,刘佳,张坤. 基于扩散Transformer网络的激光雷达数据补全方法[J]. 光通信技术,2024,48(3):52-56.
李伟松,刘 佳,张 坤*
(河北科技大学 信息科学与工程学院,石家庄 050018)
【下载PDF全文】 【下载Word】摘要:由于设备故障和环境干扰等因素,激光雷达在数据采集过程中常常存在数据缺失或噪声干扰的问题,这些问题严重影响后续数据的解析和应用。为了解决这一难题,引入了扩散Transformer网络(DT-Net),将DT-Net用作生成器,与自注意单元判别器相结合。此外,还设计了一种扩散机制用于激光雷达数据补全。实验结果表明:相较于PoinTr方法,所提出的方法在激光雷达数据补全任务方面取得了显著的改进,平均Chamfer 距离(CD)值降低了约1.79%,F-Score值提升了约1.88%。
关键词:扩散机制;数据补全;激光雷达;实际应用
中图分类号:TN929.12 文献标志码:A 文章编号:1002-5561(2024)03-0052-05
DOI:10.13921/j.cnki.issn1002-5561.2024.03.007
0 引言
激光雷达具有高分辨率的距离和速度测量能力[1],被广泛应用于城市规划、考古文物保护、自动驾驶、医疗成像等诸多领域。激光雷达通过发射和接收激光束,收集目标对象表面点的三维坐标、反射率等信息,进而快速建立目标对象的相关数据模型。然而,在激光雷达数据采集过程中,传感器会受到分辨率、单视点、遮挡、反射和回波等因素的影响,这些因素会导致部分点云数据的丢失,给后续的数据分析和处理带来了困难,从而限制了点云数据的有效应用。因此,如何进行激光雷达数据采集补全成为了一个重要的研究方向。
早期的一些学者[2-5]试图通过最小二乘法将成熟的方法从二维补全任务拓展到三维点云的采集。然而,这种方法由于存储和计算复杂度高,以及空间不一致性,导致结果不平滑,尤其在语义信息的建模方面显得不足。点补全网络(PCN)[6]是首个基于学习的点云补全架构,专注于局部补全任务,采用了自编码器结构和多尺度处理来提高补全的效果和精度。例如FoldingNet利用共享连接层和2组128×128的二维栅格对输入点云进行补全[7];TopNet引入了一个分层树形结构的解码器,用于生成对象的形状,显著改进了激光雷达数据采集补全任务[8]。然而,这些网络采用多层感知器(MLP)直接从不完整的点云中提取潜在特征,容易导致局部细节的丢失。GRNet通过独立的网格化和去网格化层,有效地将点云转换成三维网格,同时保留了内在的结构信息[9]。但GRNet仅处理全分辨率的输入数据。
根据三维点云不规则区域和缺乏有序性等特性,2021年,GUO M H等人[10]设计了一种基于Transformer网络的用于点云学习的新框架——点云转换器(PCT)。该转换器支持最远点采样(FPS)和最近邻域搜索,能更好地捕获点云的局部上下文。同年,YU X等人[11]提出了一种将点云补全重新定义到集的转换方法和用于点云补全的变压器编/解码器的架构PoinTr。该方法通过无序点组的位置嵌入来表示点云,并利用变压器模型进行点云生成;同时设计了一个几何感知模块,用于显式建模局部几何关系。然而,该方法产生参数量过大,并且在局部补全方面的效果有待提高。
基于此,本文提出一种基于扩散Transformer网络(DT-Net)的激光雷达数据补全方法,结合残差网络和自注意单元判别器网络的多尺度特征点云补全方法,以增加系统几何感知能力。
3 结束语
本文提出了一种基于DT-Net的激光雷达数据补全方法,将扩散模型与Transformer网络的编码器融合,通过点与点之间的相互作用来捕获全局依赖关系,同时在点云中传播信息以帮助识别局部之间的关联性,既增强了全局特征信息的提取,又有助于更好地理解局部特征信息。然后,将Transformer网络作为生成器与自注意判别器融合,有助于提高生成点云的质量,同时自注意判别器使得局部信息进一步增强。实验结果表明:本文所提方法除了在灯具类和沙发类的CD略高于PoinTr、GRNet外,其它各类别的CD值均优于对比方法,并且平均CD值相比最优的PoinTr方法还降低了约1.79%;与PoinTr方法相比,本文所提方法的F-Score值提升了约1.88%。
本文的方法不仅保证了点云的全局结构,并且还对局部细节信息有更好的把控,体现出了良好的泛化性和鲁棒性。这项研究对于提升激光雷达感知系统在自动驾驶、机器人导航等领域的应用具有重要意义。