摘要
随着我国公路网的不断扩展, 道路病害检测已经成为道路养护与行车安全保障必不可少的组成部分, 基于深度学习的道路病害检测已经成为该领域的研究热点. 针对多种病害并发的复杂场景下道路病害识别精度不高、泛化能力不足的问题, 提出了一种复杂场景下的道路病害检测模型RGT-YOLOv7(Receptive Ghost Triplet-YOLOv7). 在主干网络部分引入三重注意力机制, 提高病害特征在不同通道与空间的相关性, 解决了特征提取效率不高的问题;将原有的全连接空间金字塔卷积模块替换为快速全连接空间金字塔卷积模块, 并加入幻影卷积模块, 提高冗余特征的使用率, 将原有的冗余特征与新提取到的特征融合, 得到包含不同尺度的特征信息;为了扩大模型感受野, 在特征增强部分加入改进的感受野模块, 利用不同尺寸的空洞卷积从不同方向对特征图进行提取, 加强对横向和纵向特征的提取. 实验结果表明, 与YOLOv7相比, 识别的平均正确率(mean average precision, mAP)和平衡F分数分别提升了6.9、3.9个百分点, 尤其是对纵向裂缝危害识别的平均正确率提高了22.3个百分点, 与Faster R-CNN、YOLOv5等模型相比也有良好的性能提升, 表明RGT-YOLOv7是一种有效的复杂场景下的道路病害检测模型.
公路是促进国家发展与提高人民生活质量的重要基础设施, 随着我国公路网规模的不断增大以及车流量的飞速增长, 公路因自然因素与长时间的使用不可避免会出现不同类型的路面病害, 这已成为威胁行车安全的严重隐患之一. 近些年伴随着信息技术的蓬勃发展, 如何利用信息化的手段, 特别是通过图片对路面病害进行自动检测与识别成为公路养护管理领域研究重点.
目前国内外针对道路病害检测研究方法主要分为基于传统特征提取的图像分割算法和基于深度学习的方法两大类. Ding
随着信息技术的不断发展, 机器学习特别是深度学习研究浪潮的兴起, 基于深度学习的路面病害检测成为该领域的热点. Song
为了提高路面病害检测的速度, 同时保证检测精度, 单阶段目标检测模型成为目前的热门研究方法. Yi
针对多类病害并发的复杂场景下道路病害识别精度不高、模型泛化能力不足的问题,本文基于YOLOv7模型提出一种新的道路病害检测模型(receptive ghost triplet-YOLOv7,RGT-YOLOv7).为了加强特征提取效率,突出路面病害特征, 在主干网络特征输出时引入三重注意力(Triplet Attention)机制,增强病害特征在不同通道与空间的相关性;为提高特征融合效果, 使用SPPFCSPC模块替换SPPCSPC模块, 并加入幻影卷积模块增强对冗余特征的利用率, 在保留原有的小尺度特征的基础上提高对宏观特征的提取, 通过Ghost模块的残差链接将原有特征与新提取特征融合, 增强上下文特征信息之间的依赖关系;为了提高模型泛化能力, 增强对横向、纵向裂缝病害的识别能力, 在特征增强部分加入改进的感受野模块(receptive field block, RFB), 通过不同尺寸的空洞卷积进行横向与纵向的特征提取, 扩大模型感受野, 提高特征信息的全局相关性. 在公开道路病害数据集RDD2022上对提出的RGT-YOLOv7模型进行测试, 结果表明在多类道路病害并发的复杂场景下具有良好检测效率, 检测精度提升显著, 是一种有效的复杂场景道路病害检测方法.
1 相关理论
1.1 YOLOv7模型
YOLO(you only look once, YOLO)算法作为深度学习目标检测单阶段算法的经典代表, 以其运行速度快、分类精度高被广泛应用于目标检测的相关工作中. YOLOv7作为YOLO系列新推出的算法, 集成了YOLOv

图1 YOLOv7结构图
Fig.1 YOLOv7 structure diagram
1.2 Ghost卷积
传统卷积为了提取更加全面的特征,通常会使用卷积核对特征图进行反复卷积,这会产生大量冗余特征,对模型精度影响较大且计算量庞大.Ghost卷积是由Han

图2 Ghost模型原理图
Fig.2 Schematic diagram of Ghost model
假设输入特征图为, 、和分别为特征图高、宽和通道数, 经过第一步卷积计算后输出特征图为, 、和分别为特征图高、宽和通道数, 常规卷积核大小为, 线性变化卷积核大小为, 则经过次变换后普通卷积与Ghost卷积的计算量比值如
(1) |
由
1.3 Triplet注意力机制
YOLOv7模型结构复杂、提取特征种类与数量多, 要准确地关注到路面病害特征比较困难, 经常因为模型层数的增加忽视许多有用的细小特征, 对病害检测精度有很大的影响, 针对以上问题, 本文引入Triplet注意

图3 Triplet注意力原理图
Fig.3 Triplet attention schematic diagram
2 RGT-YOLOv7路面病害检测模型
2.1 Ghost-SPPFCSPC模块
YOLOv7中的SPPCSPC模块由空间金字塔池化(spatial pyramid pooling, SPP)模块和全连接空间金字塔卷积(fully connected spatial pyramid convolution, CSPC)结构组成, SPP通过对特征图的不同尺度池化, 获得不同尺度的感受野, 有效解决了图像由于裁剪、缩放引起的特征细节丢失问题, CSPC结构给原有的SPP模块加上了残差结构, 提升特征提取效果, 但由于传统卷积在特征提取方面的局限性,许多病害特征无法得到有效的利用. 本文借鉴 YOLOv5中的SPPF层结构, 引入Ghost模块, 提出Ghost-SPPFCSPC模块替换原有的SPPCSPC模块, 模块结构如

图4 Ghost-SPPFCSPC模块结构
Fig.4 Ghost-SPPFCSPC module structure
首先将部分卷积替换为Ghost模块, 强化特征提取时大量冗余特征利用率, 提高特征提取效率, 其次用三个池化核为5的最大池化层替换原池化核为5、9、13的三个最大池化层, 在保留细节特征信息的前提下, 增强宏观特征的提取, 提升模块运算速度, 将Ghost模块中提取出的特征信息进行多次池化操作, 获得不同感受野下的特征信息, 最后将这些特征信息同残差链接输出拼接起来, 从不同尺度获得更多类型的特征信息, 极大地扩大模型感受野, 提升模型识别精度.
2.2 RFBs模块
YOLOv7网络结构复杂, 输入道路病害图像在经过大量卷积后会产生许多与路面病害无关的冗余特征向量,对所需特征的提取与模型鲁棒性有很大影响,因此本文在特征增强阶段引入RFBs模块, 增强病害特征的分辨能力,以广阔的感受野提升病害特征的全局相关性.RFBs模块结构如

图5 RFBs模块结构图
Fig.5 RFBs module structure diagram
2.3 RGT-YOLOv7模型
道路病害包括裂缝、坑槽、松散、塌陷等多种类型, 实际工程中要求准确识别各类病害, 及时采取不同措施修复维护道路, 但在拍摄的路面图片中, 经常出现多种病害并存的复杂场景, 此外, 每种病害尺寸还经常发生变化, 例如纵向裂缝呈现尺寸变化的细长条状. YOLOv7网络是目标检测常用算法之一, 但检测目标大多有固定形状特征,在特征检测时按照[12,16,19,36,40,28]、[36,75,76,55,72,146]、[142,110,192,243,459,401]三种锚框尺寸对目标进行特征提取,而对于路面病害尤其是裂缝病害形状特征比较特殊的细长条状,传统的特征提取受限于锚框尺寸固定而出现特征提取位置不精准,导致现有的目标检测模型难以有效提取病害特征,经常出现漏检, 导致模型检测精度不高,泛化能力差.针对现有模型特征提取效率不高,多种病害并存难以全部识别, 如何同时提高检测精度与模型泛化性的问题, 本文提出一种基于YOLOv7的改进模型RGT-YOLOv7, 模型结构图如

图6 RGT-YOLOv7模型结构图
Fig.6 RGT-YOLOv7 model structure diagram
针对YOLOv7模型对于所需特征信息敏感度不高的问题, 在主干特征提取层三个输出位置引入Triplet注意力模块, 在不降低维度的前提下利用多维交互提高路面病害特征重要性, 提高网络特征提取能力, 解决因网络不断加深,特征信息消失的问题;针对传统卷积计算量大, 无法利用冗余特征产生更有效特征信息的问题, 本文设计了一种新的Ghost-SPPFCSPC模块, 通过利用Ghost模块替换部分卷积的方式, 将普通卷积产生的大量相似的冗余特征充分利用, 将原有的多种病害特征保留, 强化特征之间的相关性;针对YOLOv7模型对纵向裂缝检测精度不高的问题, 在三个不同尺度的特征输出位置加入RFBs, 模块利用三个不同尺寸的空洞卷积分别从横向和纵向提取病害信息, 加强横向裂缝与纵向裂缝的特征能力, 同时扩大模型感受野, 提高病害特征的全局相关性, 提高模型泛化能力.
假设为输入图片,,具体如
(2) |
(3) |
式中:为经过BatchNorm层产生的输入权重; 代表对特征图进行池化的维度;为卷积步长.
输入图片在经过四个卷积核大小一致、卷积步长不同的CBS模块后, 将提取出的特征信息送入ELAN模块中进行特征增强, ELAN模块通过对不同特征组合处理, 得到更多与原特征相关的特征信息, 同时可以保留特征的梯度信息, 具体计算如
(4) |
式中:为经过卷积步长为的CBS模块后的特征信息输出;与为经过不同次CBS模块后的特征信息输出;为特征信息经过ELAN层增强后的特征输出;亦作为Triplet模块特征输入, 通过三分支结构捕获不同维度与通道之间的特征相关性, 利用旋转操作和残差结构建立维度间的依存关系, 具体计算如
(5) |
(6) |
式中:代表对特征图进行池化的维度;、、代表对输入特征分别进行空间维度与通道维度、空间维度与通道维度、空间维度与之间特征相关性捕获;代表三条分支特征融合输出.
将与路面病害具有很高相关性的特征信息作为Ghost-SPPFCSPC模块特征输入, 通过Ghost模块的冗余特征利用, 保留特征信息中很多高效特征信息, 并通过残差链接与多尺度的其他特征信息融合产生出更多具有丰富特征的病害特征信息, 将Ghost-SPPFCSPC模块输出与其他尺度特征拼接与特征增强后的输出特征作为RFBs模块输入, 通过不同卷积核大小的空洞卷积对输入特征进行多尺度的特征提取,扩大了模型感受野, 增强特征的全局相关性与模型泛化能力, 具体计算如
(7) |
式中:为RFBs模块在不同分支上的特征输出;为RFBs模块对不同分支特征提取结果进行融合后与残差链接的特征输出; 为空洞卷积; 为空洞卷积扩张率.
对其他两条特征提取分支进行相同操作, 通过上采样产生不同尺度大小的特征映射, 最终输出三种不同尺度的病害特征映射信息, 利用其实现路面病害的分类与识别.
3 实验及结果分析
3.1 数据集介绍
本文使用数据集为开源数据集RDD202
3.2 实验环境及参数
本文实验是在装载Ubuntu18.04的Linux 操作系统下进行的,实验所使用的硬件配置为:GPU 为 3块11 GB 显存的 NVIDIA GeForce RTX 2080Ti, CPU 为Intel Xeon E5-2620 v4@ 2.10 GHz,32 GB的运行内存.编程环境:Python 3.7以及Pytorch 1.7版本的深度学习框架,训练时使用YOLOv7 预训练权重,设置Batch size为4,Epoch为100.
3.3 评价指标
为评估算法模型的效果, 通常采用召回率(R)、准确率(P)、平衡F分数(F1)、平均正确率(mAP@0.5)、帧率(FPS)、每秒浮点运算次数(FLOPs)和模型参数量作为评价指标, 其中召回率、准确率、平衡F分数、平均正确率、帧率越高代表模型检测效果越好, 浮点运算量和模型参数量越低代表模型复杂度越低. 召回率代表正确检测样本在总样本中的比例, 准确率代表正确检测样本在所有检测到的样本中的比例, F1分数为二者加权平均, mAP是衡量模型准确性优劣的重要标准, 计算公式分别如式(8)~
(8) |
(9) |
(10) |
(11) |
式中: 代表被网络检测到并正确分类的病害数量;代表属于病害但是没有被正确检测出来的病害数量;代表被错误识别成病害的背景区域数量;表示P与所围曲线的面积;为检测目标类别数.
3.4 实验结果分析
3.4.1 对比实验
为了验证所提出模型在多种道路病害并发的复杂场景下检测识别的有效性和可行性, 在相同设备环境条件下, 分别选取了病害目标较小、多类病害并发、病害形状特殊、病害图像光照不足四种多病害并发复杂场景下的道路病害图片的检测结果, 并与目前一些主流深度学习目标检测模型进行对比, 结果分别如

(a) 病害目标较小

(b) 多类病害并发

(c) 病害形状特殊

(d) 病害图像光照不足
图7 不同模型测试对比图
Fig.7 Comparison diagram of different models test
为了进一步说明本文所提出模型在道路病害检测中的有效性,对本文模型与目前现有的主流和最新提出的方法在相同数据集中进行对比, 对比结果如
模型 | P/% | R/% | mAP@0.5/% | F1/% | 帧率/(帧· |
---|---|---|---|---|---|
Faster R-CNN | 26.1 | 45.1 | 37.4 | 38.4 | 19 |
YOLOv5 | 56.5 | 50.4 | 51.8 | 50.6 | 72 |
YOLOv7 | 59.7 | 55.5 | 54.9 | 57.5 | 56 |
YOLO-LRD | 59.2 | 58.2 | 57.6 | 58.7 | 86 |
LE-YOLOv | 63.9 | 53.2 | 56.9 | 58.1 | 71 |
PD-YOL | 59.4 | 55.1 | 55.9 | 57.2 | 56 |
MN-YOLOv | 57.2 | 56.0 | 53.6 | 56.6 | 42 |
GSC-YOLOv | 57.2 | 57.8 | 54.6 | 57.5 | 53 |
RGT-YOLOv7 | 62.4 | 60.4 | 61.8 | 61.4 | 54 |
3.4.2 消融实验
为了验证提出模型RGT-YOLOv7用于道路病害检测时各部分的有效性, 本文将YOLOv7模型作为基准模型, 保证其他参数与实验环境不变的条件下, 将各模块分别组合进行实验, 在检测精度等方面进行对比, 消融实验结果如
网络设置 | mAP@0.5/% | F1/% | Parameters/M | FLOPs/G | ||||
---|---|---|---|---|---|---|---|---|
组别 | Ghost | SPPFCSPC | RFBs | Triplet | ||||
1 | 基线网络 | 54.9 | 57.5 | 37.2 | 105.2 | |||
2 | √ | 54.9 | 56.3 | 35.8 | 104.0 | |||
3 | √ | 55.7 | 56.8 | 37.2 | 105.2 | |||
4 | √ | 59.2 | 59.6 | 59.0 | 145.2 | |||
5 | √ | 56.8 | 57.4 | 37.2 | 105.3 | |||
6 | √ | √ | 57.9 | 58.3 | 35.8 | 104.0 | ||
7 | √ | √ | √ | 59.3 | 59.8 | 57.6 | 144.0 | |
8 | √ | √ | 59.4 | 59.9 | 59.0 | 145.2 | ||
9 | √ | √ | √ | 58.3 | 58.7 | 35.8 | 104.1 | |
10 | √ | √ | √ | √ | 61.8 | 61.4 | 57.6 | 144.1 |
从
3.4.3 泛化性实验
为验证模型对不同病害类型的识别有效性, 本文利用RGT-YOLOv7模型与YOLOv7原始模型对四种常见路面病害进行检测, 各类病害平均检测精度结果如
模型 | D00 | D10 | D20 | D40 |
---|---|---|---|---|
YOLOv7 | 39.3 | 54.2 | 67.8 | 58.2 |
RGT-YOLOv7 | 61.6 | 56.4 | 69.5 | 59.3 |
从
为进一步评估提出的RGT-YOLOv7模型的泛化能力, 本文在相同参数设置与环境下, 选用公开道路病害数据集RDD2022-美国和RDD2022-印度进行验证, 验证结果如
数据集 | 模型 | mAP@0.5 | F1 |
---|---|---|---|
RDD2022-美国 | YOLOv7 | 50.7 | 54.3 |
RGT-YOLOv7 | 57.1 | 55.2 | |
RDD2022-印度 | YOLOv7 | 35.8 | 40.0 |
RGT-YOLOv7 | 41.7 | 43.1 |
从
4 结 论
针对道路病害检测中因多种病害并发、影响因素多、病害尺寸不统一、病害数目多等原因导致的模型检测精度低、泛化能力差的问题, 本文在YOLOv7模型基础上提出一种增大感受野, 提高模型特征提取利用率的检测算法RGT-YOLOv7. 在主干网络部分加入Triplet注意力模块提高对路面病害特征提取效率, 将SPPCSPC模块改为SPPFCSPC模块,同时引入Ghost模块, 保证感受野不变的前提下, 保留细小特征, 提高对宏观特征的提取效果, 并将输入特征通过Ghost模块与残差链接和最终输出特征拼接, 提高特征相关性, 加入RFBs模块,从多个方向和尺度提取病害特征, 增强模型感受野, 提高不同方向特征信息提取能力. 实验结果显示,相较YOLOv7算法, RGT-YOLOv7模型mAP和F1分数方面分别提高6.9、3.9个百分点, 与YOLOv5、Faster R-CNN和最近提出的新模型相比也有较好的性能提升, 并在不同数据集上的测试结果相较YOLOv7都有不错的准确度提升, 表明RGT-YOLOv7网络模型具有良好的泛化能力, 为多种病害并发的复杂场景下进行道路病害检测提供了一种可能, 未来将进一步研究在进一步提升网络检测精度的同时, 如何对病害的尺寸进行识别, 以更好满足实际工程的需求.
参考文献
DING S,XING Y Y,LANG H,et al.Line-structured light rut detection of asphalt pavement with pavement markings interference under strong light[J].Journal of Transportation Engineering,Part B: Pavements, 2022, 148(2): 04022007. [百度学术]
ZHANG D J,LI Q Q,CHEN Y,et al.An efficient and reliable coarse-to-fine approach for asphalt pavement crack detection[J].Image and Vision Computing,2017,57:130-146. [百度学术]
SONG L,WANG X C.Faster region convolutional neural network for automated pavement distress detection[J].Road Materials and Pavement Design,2021,22(1):23-41. [百度学术]
GIRSHICK R,DONAHUE J,DARRELL T,et al.Rich feature hierarchies for accurate object detection and semantic segmentation[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition.June 23-28,2014,Columbus,OH,USA:IEEE,2014:580-587. [百度学术]
薛亚东,高健,李宜城,等.基于深度学习的地铁隧道衬砌病害检测模型优化[J].湖南大学学报(自然科学版),2020,47(7):137-146. [百度学术]
XUE Y D,GAO J,LI Y C,et al.Optimization of shield tunnel lining defect detection model based on deep learning[J].Journal of Hunan University (Natural Sciences),2020,47(7):137-146.(in Chinese) [百度学术]
肖力炀,李伟,袁博,等.一种基于改进实例分割模型的路面裂缝检测方法[J].武汉大学学报(信息科学版),2023,48(5):765-776. [百度学术]
XIAO L Y,LI W,YUAN B,et al.A pavement crack identification method based on improved instance segmentation model[J]. Geomatics and Information Science of Wuhan University,2023,48(5):765-776.(in Chinese) [百度学术]
YI C C,LIU J,HUANG T,et al.An efficient method of pavement distress detection based on improved YOLOv7[J].Measurement Science and Technology,2023,34(11):115402. [百度学术]
WANG C Y,BOCHKOVSKIY A,LIAO H Y M. YOLOv7:trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).June 17-24,2023,Vancouver,BC,Canada:IEEE,2023:7464-7475. [百度学术]
YANG L, ZHANG R, LI L , et al. SimAM: A Simple, Parameter-Free Attention Module for Convolutional Neural Networks[C]// Proceedings of the 38th International Conference on Machine Learning (ICML). June 18-24, Cambridge: PLMR, 2021: 11863-11874. [百度学术]
LIU Y H,DUAN M L,DING G G,et al.HE-YOLOv5s:efficient road defect detection network[J]. Entropy, 2023, 25(9): 1280. [百度学术]
何铁军, 李华恩.基于改进YOLOv5的路面病害检测模型[J].土木工程学报,2024,57(2):96-106. [百度学术]
HE T J,LI H E.Pavement damage detection model based on improved YOLOv5[J].China Civil Engineering Journal,2024,57(2):96-106.(in Chinese) [百度学术]
余加勇,刘宝麟,尹东,等.基于YOLOv5和U-Net3+的桥梁裂缝智能识别与测量[J].湖南大学学报(自然科学版),2023,50(5):65-73. [百度学术]
YU J Y, LIU B L, YIN D,et al. Intelligent identification and measurement of bridge cracks based on YOLOv5 and U-Net3+[J]. Journal of Hunan University (Natural Sciences), 2023, 50(5): 65-73. (in Chinese) [百度学术]
GE Z,LIU S T,WANG F,et al.YOLOX:exceeding YOLO series in 2021[EB/OL]. https://arxiv.org/abs/2107. 08430v2 [百度学术]
DING X H,ZHANG X Y,MA N N,et al.RepVGG:making VGG-style ConvNets great again[C]//2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).June 20-25,2021,Nashville,TN,USA:IEEE,2021:13728-13737. [百度学术]
LEE Y,HWANG J W,LEE S,et al.An energy and GPU-computation efficient backbone network for real-time object detection[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).June 16-17,2019,Long Beach,CA,USA: IEEE,2019:752-760. [百度学术]
WANG C Y,MARK LIAO H Y,WU Y H,et al.CSPNet:a new backbone that can enhance learning capability of CNN[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).June 14-19,2020,Seattle,WA,USA: IEEE,2020:1571-1580. [百度学术]
HAN K,WANG Y H,TIAN Q,et al.GhostNet:more features from cheap operations[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).June 13-19,2020,Seattle,WA,USA:IEEE,2020:1577-1586. [百度学术]
MISRA D,NALAMADA T,ARASANIPALAI A U,et al.Rotate to attend:convolutional triplet attention module[C]//2021 IEEE Winter Conference on Applications of Computer Vision (WACV).January 3-8,2021,Waikoloa,HI,USA:IEEE,2021:3138-3147. [百度学术]
SZEGEDY C,LIU W,JIA Y Q,et al.Going deeper with convolutions[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).June 7-12,2015,Boston,MA,USA:IEEE,2015:1-9. [百度学术]
ARYA D,MAEDA H,GHOSH S K,et al.RDD2022:a multi-national image dataset for automatic Road Damage Detection[EB/OL].https://arxiv.org/abs/2209.08538v1 [百度学术]
WAN F,SUN C,HE H Y,et al. YOLO-LRDD: a lightweight method for road damage detection based on improved YOLOv5s[J].EURASIP Journal on Advances in Signal Processing,2022(1):98. [百度学术]
DIAO Z,HUANG X F,LIU H,et al.LE-YOLOv5:a lightweight and efficient road damage detection algorithm based on improved YOLOv5[J].International Journal of Intelligent Systems,2023:8879622. [百度学术]
GUO G G,ZHANG Z Y.Road damage detection algorithm for improved YOLOv5[J].Scientific Reports,2022,12(1):15523. [百度学术]
WANG J H,GAO X H,LIU Z,et al.GSC-YOLOv5:an algorithm based on improved attention mechanism for road creak detection[C]//2023 IEEE 12th Data Driven Control and Learning Systems Conference (DDCLS). May 12-14,2023,Xiangtan,China: IEEE,2023:1664-1671. [百度学术]