摘要
及时且准确捕获井壁出现的微小裂缝,对于井筒安全意义重大.轻量化检测模型是推动井壁裂缝自动检测的关键,打破现有方法聚焦于提取深层语义信息的局限,重视浅层特征表征的几何结构信息的应用,针对井壁裂缝提出轻量化检测模型E-YOLOv5s.首先融合普通卷积、深度可分离卷积和ECA注意力机制设计轻量化卷积模块ECAConv,再引入跳跃链接构建特征综合提取单元E-C3,得到骨干网络ECSP-Darknet53,它负责显著降低网络参数,同时增强对裂缝深层特征的提取能力.然后设计特征融合模块ECACSP,利用多组ECAConv和ECACSP模块组建细颈部特征融合模块E-Neck,旨在充分融合裂缝小目标的几何信息和表征裂缝开裂程度的语义信息,同时加快网络推理速度.实验表明,E-YOLOv5s在自制井壁数据集上的检测精度相较YOLOv5s提升了4.0%,同时模型参数量和GFLOPs分别降低了44.9%、43.7%.E-YOLOv5s有助于推动井壁裂缝自动检测的应用.
井筒是煤炭开采的咽喉要道,井壁裂缝引起的破裂会造成重大灾害,定期检查井壁并对裂缝、渗水等缺陷及时维护来保证井筒安全,对于推动煤炭资源安全、高效开采具有重要意
井壁缺陷自动检测是绿色矿山的未来趋势,计算性能的显著提高已经大大促进了深度学习技术在道路、桥梁等裂缝检测领域的应用.如李良福
裂缝小目标缺陷的检测对井筒安全至关重要,检测模型除了要能准确提取出微小裂缝特征还必须轻量,才能推动井壁裂缝检测的智能化.出色的轻量级网络模型,如MobileNe
像素级方法也已应用于混凝土裂缝检测.例如,Doğan
综上,为了实现井壁裂缝缺陷的自动检测,致力于完成裂缝小目标准确提取和模型轻量化的目标,设计轻量化卷积模块、特征综合提取模块,并构建骨干网络和细颈部特征融合模块,提出井壁裂缝小目标缺陷的轻量化检测模型E-YOLOv5s,它既能够增强网络特征提取能力,又能减轻模型复杂度,更好地平衡模型的准确性和轻量化.
1 小目标缺陷检测模型E-YOLOv5s
1.1 设计思想
立井跨度大、复杂的地质构造容易引起井壁裂缝出现,轻量化、高精度检测模型才能有助于井壁裂缝自动检测的落地应用.井壁裂缝方向多变、开裂程度不一,且井壁背景复杂,必须挖掘出井壁图像中包含的浅层几何信息和深层语义信息,再将几何信息表征的裂缝拓扑结构和语义信息表达的细微小目标进行充分融合,才能准确检测出复杂背景下的裂缝信息.
YOLOv5是目前YOLO系
1.2 E-YOLOv5s模型结构
鉴于上述思想,针对井壁裂缝缺陷检测,设计

图1 E-YOLOv5s模型结构
Fig.1 E-YOLOv5s module structure diagram
一是设计了轻量化卷积模块ECAConv,它借助深度可分离卷积降参,再利用通道关注(ECA)模
二是提出了特征融合模块ECACSP,它的结构受CS
1.3 骨干网络ECSP-Darknet53
井壁裂缝缺陷属于细微小目标,特征提取时更要注重表征裂缝拓扑结构的浅层信息.在有效提取浅层信息对应的几何结构后,再最大化地充分提取深层特征表征的语义信息,才有助于实现对裂缝小目标的检测.为此,借鉴YOLOv5的结构,设计骨干网络ECSP-Darknet53,它由1个CBS单元(6×6Conv+BN+SiLU)、4个ECAConv构成的EBS(ECAConv+BN+SiLU)单元、4个E-C3模块和1个SPPF构成.
待检测图像输入网络后,将其通过6×6卷积扩展通道,发送到4个顺序连接的EBS+E-C3单元组,实现输出特征通道数量的扩展和压缩.我们的目标是通过多次升维后再多通道降维的策略,挖掘出更多多维、多尺度的互补特征.SPPF对4组EBS+E-C3单元提取的互补特征进行空间金字塔池化,解决了相关特征重复提取的问题,大大提高了候选框的生成速度,从而节省了计算成本.
1.3.1 轻量化卷积模块ECAConv设计
YOLOv5s主干网络中采用大量重复的普通卷积与BN、SiLU激活函数组成的卷积块对输入图像进行特征提取,参数量较大,不利于终端设备的部署.轻量化设计可有效缓解当前阶段高计算成本的问题,这一目的主要通过使用深度可分离卷积操作来实现,以减少参数和浮点运算的数量.深度可分离卷积在计算过程中分离了输入图像的通道信息,容易丢失输入图像的细节信息,这一缺陷导致深度可分离卷积的特征提取和融合能力远低于普通卷积.然而,井筒低照度、高污染的复杂环境下,井壁裂缝细微、颜色相对背景呈暗色,特征对应的像素值小,仅使用普通卷积对井壁裂缝特征提取能力不足.为此,设计了
(1) |
其中表示1×1卷积操作,度可分离卷积,表示级联操作,表示通道关注操作.

图2 ECAConv结构图
Fig.2 ECAConv module structure diagram
1×1卷积保留了输入图像的原始特征信息,深度可分离卷积减少模型的参数和浮点数运算,二者结合相比于仅使用深度可分离卷积对模型进行轻量化,保留了输入图像的细节信息.同时,两种卷积方式能让网络提取更丰富的特征信息.ECA模块通过考虑每个通道及其k个邻域交互捕获局部跨通道信息,通过通道间的信息交互将普通卷积获得的信息和深度可分离卷积获得的信息混合交互在一起,使提取的特征信息更加丰富但又没有引入过多的参数,符合设计的目标.同时加入ECA注意力机制,可以让网络更加关注裂缝特征信息,提高检测效果.
1.3.2 特征综合提取单元E-C3
设计的ECAConv模块通过扩展特征通道数量的方式,从浅层特征挖掘出丰富的几何信息.为了解决通道数增加引起的连接参数增加的问题,设计

图3 E-C3模块结构图
Fig.3 E-C3 module structure diagram
E-C3由3个ECAConv和n个ECABottleNeck组成,骨干网络ECSP-Darknet53中依次包含的4个E-C3中含有ECABottleNeck的数量分别为3、6、9、3.ECABottleNeck借助跳跃连接将输入特征和经过2个ECAConv提取的特征进行Concat融合.特征综合提取单元E-C3的特征提取过程为:
(2) |
式中:和分别表示E-C3模块的输入、输出特征;表示对通过一次ECAConv映射提取的特征;表示n个ECABottleNeck的输出,表示ECAConv模块的映射函数;表示ECABottleNeck模块的映射函数;表示级联操作.
浅层残差模块的输出特征分辨率高,几何细节信息表征能力强,包含更多的目标位置信息,但缺乏语义信息,深层残差模块的输出特征经过多次卷积下采样操作,语义信息表征能力强,但缺乏空间几何特征信息.所以融合深层和浅层残差模块的特征细节有助于实现对井壁裂缝信息的全面检测.E-C3通过堆叠多个ECAConv实现裂缝特征的全面提取,同时对减少网络连接参数有推动作用.
1.3.3 空间金字塔池化SPPF
空间金字塔池化SPPF模块的结构如

图4 SPPF模块结构图
Fig.4 SPPF module structure diagram
2.4 细颈部特征融合模块E-Neck
YOLOv5s在细颈部使用普通卷积和不含跳跃连接的C
井壁裂缝的特征信息与背景较为相似,且井壁裂缝相对整幅图像属于小目标.为了有效利用骨干网络ECSP-Darknet53提取的特征信息,必须充分融合裂缝小目标的几何信息和语义信息,为此,设计了细颈部特征融合模块E-Neck,结构见
特征融合模块ECACSP的结构如
(3) |
式中:和分别表示ECACSP模块的输入、输出特征;表示CBS单元的映射函数;表示EBS单元的映射函数;表示级联操作.

图5 ECACSP模块结构图
Fig.5 ECACSP module structure diagram
ECACSP模块的第一个CBS单元最大程度地保留原始特征融合信息,2个EBS模块负责捕捉更多的细节信息,同时EBS模块结构中的ECA注意力机制采用一种更有效的学习方式,通过内核的快速一维卷积来共享相同的学习参数,让模型具有更轻体积的同时有效捕获了跨通道交互,提高了特征融合的质量,进一步提高了网络检测精度.将二者融合的特征信息拼接在一起后输入最后一个CBS模块.通过这种跨阶段层次结构实现更丰富的梯度组合和特征表达能力,加强网络特征融合的能力,降低了计算和网络结构的复杂性,但保持了足够的准确性,加快了推理速度.当井壁裂缝图像信息进入特征融合部分,5个EBS模块作为压缩层用来恢复输出特征的通道数,旨在融合更多的细节信息.
2 实验与结果分析
2.1 实验配置与评价指标
实验在CPU 型号为Intel Core i7-10700k @ 3.80 GHz,GPU 型号为NVDIA GeForce RTX 2080Ti,11G显存,32 G内存的PC上开展,利用Pytorch框架搭建模型,并使用Cuda10.0和Cudnn7.6.5对GPU进行加速.实验相关参数设置见
相关参数 | 设置值 | 相关参数 | 设置值 |
---|---|---|---|
批处理尺寸 | 16 | 动量值 | 0.937 |
图片尺寸 | 640 | 初始学习率 | 0.000 1 |
训练周期 | 300 | 衰减系数 | 0.000 5 |
2.2 数据集构建
利用采集的井壁图像制作数据集,其中包含健康井壁图像和缺陷井壁图像.根据裂缝开裂程度,可将缺陷分为四种类型:严重(serious)、中等(medium)、轻微(light)和正常(normal).在完成数据集图像的分割和压缩后,使用labelImg软件对所有图像中的上述类别目标进行标注.严重裂缝和中等裂缝有明显的裂纹,无分支裂缝.而对于轻微的裂缝,它可能包含多个裂缝并伴有分支裂缝.在标注数据集时,我们还对轻微裂缝中包含的分支裂缝进行单独标注,以便算法也能识别分支裂缝.基于此,严重裂缝和中等裂缝图像只有1个标注,而轻微裂缝图像包含1~3个标注.数据集由标注样本数据库中的3 000张图像组成,分别包括1 000张严重、中等、轻微缺陷类型的井壁裂缝图像,每张图像的分辨率为640×640.井壁裂缝数据集按8∶1∶1的比例分为训练集、验证集和测试集.训练集中有2 400张图像,验证集和测试集中分别有300张图像.
2.3 过拟合
过拟合现象表现为最终模型在训练集上效果较好,但在测试集上效果较差,模型泛化能力较弱.导致过拟合的原因包括训练集的数量级小于模型复杂度,模型记住了样本数据中的噪声特征而忽略了真实的输入输出关系.为了缓解模型可能存在的过拟合问题,采取了以下措施:
1)在设计检测模型时,在卷积神经网络的每一层之间增加了一个BN层.目的是将神经元的权重调整为标准的正态分布,使每一层的训练都从相似的起点开始.拉伸权值对应于拉伸特征,拉伸特征对应于输入层的数据增强.
2)通过翻转和平移井壁裂缝图像,扩大训练数据集,使模型尽可能多地看到异常.这样可以保证模型在训练过程中不断自我修正,从而获得更好的结果,提高模型的泛化能力.
2.4 网络训练
在YOLOv5s算法中,针对不同的数据集,都会有初始设定长宽的锚框.在网络训练中,网络在初始锚框的基础上输出预测框,进而和真实框GT进行比对,计算两者差距,再反向更新,迭代网络参数,自适应地计算不同训练集中的最佳锚框值.因此初始锚框也是比较重要的一部分,本文采用YOLOv5s官方给出的初始设定的锚框,见

图6 初始锚框信息
Fig.6 Initial anchor frame information
采用YOLOv5s的损失函数,在自制井壁裂缝缺陷数据集上开展训练,结果分别见

图7 损失曲线图
Fig.7 Loss comparison chart

图8 检测准确率曲线图
Fig.8 Detection accuracy comparison chart
2.5 实验结果与分析
2.5.1 消融实验
为了验证骨干网络ECSP-Darknet53、细颈部特征 融合模块E-Neck及E-YOLOv5s的有效性.以YOLOv5s的基础,在自制数据集上开展4个实验,分别是用ECSP-Darknet53和E-Neck不替换、依次替换和共同替换YOLOv5s中的相应部分.实验结果见
实验 | 模型 | Parameters/M | GFLOPs | Precision/% | Recall/% | mAP0.5/% |
---|---|---|---|---|---|---|
1 | YOLOv5s | 7.02 | 15.8 | 78.1 | 78.7 | 81.9 |
2 | YOLOv5s+ECSP-Darknet53 | 5.32 | 11.6 | 75.4 | 79.2 | 84.3 |
3 | YOLOv5s+E-Neck | 5.57 | 13.1 | 77.0 | 77.9 | 82.5 |
4 | E-YOLOv5s | 3.87 | 8.9 | 78.6 | 80.1 | 85.2 |
实验1和2表明,ECSP-Darknet53对于降低参数量具有明显效果,它将YOLOv5s的模型参数量和浮点运算量GFLOPs分别降低了24.2%、26.6%,虽然Precision略有降低,但Recall和综合指标mAP均有明显增加.实验1和3表明,E-Neck使得模型参数量和浮点数运算相较于YOLOv5s,分别降低20.7%和17.1%,同时将综合指标mAP提高了0.7.实验4是文中设计的小目标缺陷检测模型E-YOLOv5s,它同时加入了ECSP-Darknet53和E-Neck,对比实验1可见,相比YOLOv5s,E-YOLOv5s的模型参数量和浮点运算量GFLOPs分别降低了44.9%、43.7%,且Precision和 Recall均有提升,尤其综合指标mAP比 YOLOv5s提升了4.0%.
综上,ECSP-Darknet53以牺牲较小的Precision为代价,大幅度降低了网络模型参数,提升了网络的检测精度,E-Neck通过捕捉更多细节信息,加强特征融合能力,同时借助更多的梯度信息丰富了特征图的语义信息.ECSP-Darknet53和E-Neck设计合理,均达到了预期的设计要求.E-YOLOv5s不仅降低了模型参数和浮点运算,还提升了模型的检测精度,对网络模型实现了轻量化,有助于推动井壁缺陷检测的实际应用.
2.5.2 ECAConv模块验证实验
消融实验充分证明了E-YOLOv5s模型的合理性.为进一步验证ECAConv模块的泛化性能,将ECAConv模块替换经典的目标检测模型YOLOv3-SP
模型 | Parameters/M | GFLOPs | Precision/% | Recall/% | mAP0.5/% |
---|---|---|---|---|---|
YOLOv3-SPP | 62.6 | 155.4 | 79.2 | 77.1 | 81.5 |
ECAConv-YOLOv3-SPP | 32.2 | 79.5 | 76.0 | 80.2 | 83.2 |
YOLOv4-CSP | 52.5 | 119 | 79.3 | 78.8 | 83.2 |
ECAConv-YOLOv4-CSP | 25.9 | 54.5 | 75.3 | 81.7 | 84.7 |
YOLOv5s | 7.02 | 15.8 | 77.0 | 78.7 | 81.9 |
ECAConv-YOLOv5s | 3.96 | 9.1 | 78.6 | 82.1 | 83.5 |
YOLOv7 | 37.2 | 105.1 | 77.5 | 78.2 | 82.3 |
ECAConv-YOLOv7 | 26.7 | 65.4 | 79.3 | 80.1 | 83.4 |
由
2.5.3 E-YOLOv5s的性能验证
为了验证E-YOLOv5s的整体性能,将它与YOLOv3-SP
方法 | Parameters/M | GFLOPs | Precision/% | Recall/% | mAP0.5/% |
---|---|---|---|---|---|
YOLOv3-SPP | 62.6 | 155.4 | 79.2 | 77.1 | 81.5 |
YOLOv4-CSP | 52.5 | 119 | 79.3 | 78.8 | 83.2 |
YOLOv5s | 7.02 | 15.8 | 77.0 | 78.7 | 81.9 |
YOLOX-s | 9.0 | 26.8 | 81.9 | 83.4 | 84.6 |
YOLOv7 | 37.2 | 105.1 | 77.5 | 78.2 | 82.3 |
E-YOLOv5s | 3.87 | 8.9 | 78.6 | 80.1 | 85.2 |
为了全面比较几种算法在不同背景下对裂缝小目标缺陷的检测效果,在测试集中随机选取4组小裂缝井壁缺陷图像进行检测,各类算法检测结果如

图9 经典模型检测效果对比图
Fig.9 Comparison chart of the detection effect of the classic model
2.5.4 E-YOLOv5s在公共数据集上的性能验证
上述实验充分证明了E-YOLOv5s在自制井壁裂纹数据集上的有效性.为了进一步验证E-YOLOv5s 的泛化性能,我们继续在公共数据集Aft Original Crack DataSet Second (AOCDS
方法 | Parameters /M | GFLOPs | Precision /% | Recall /% | mAP0.5 /% |
---|---|---|---|---|---|
YOLOv3-SPP | 62.6 | 155.4 | 81.3 | 79.8 | 84.2 |
YOLOv4-CSP | 52.5 | 119 | 79.5 | 80.9 | 85.3 |
YOLOv5s | 7.02 | 15.8 | 82.0 | 81.4 | 84.6 |
YOLOX-s | 9.0 | 26.8 | 83.7 | 85.4 | 86.6 |
YOLOv7 | 37.2 | 105.1 | 82.4 | 80.7 | 85.0 |
E-YOLOv5s | 3.87 | 8.9 | 80.1 | 82.5 | 87.2 |
3 结论
井壁裂缝小目标的缺陷检测对煤矿安全开采至关重要,文中提出的检测网络E-YOLOv5s有助于推动裂缝缺陷的智能检测.主干网络ECSP-Darknet53中的轻量化卷积模块ECAConv和特征综合提取单元E-C3,能够减少网络模型参数量和浮点运算量,有效提取浅层信息对应的几何结构,实现对裂缝小目标缺陷的准确检测.细颈部特征融合模块E-Neck中设计的ECACSP模块,有助于加快网络推理速度.E-Neck能将几何信息表征的裂缝拓扑结构和语义信息表达的细微小目标进行充分融合,改善特征融合过程中细节信息的丢失问题.E-YOLOv5s检测井壁裂缝小目标缺陷时的综合指标mAP值达到了85.2%,相比YOLOv5s原始网络提升了4.0%,网络模型参数量和浮点运算分别下降了44.9%和43.7%,且Precision和Recall都略有提升,无论是在提升检测精度方面还是压缩模型体积都有令人满意的结果,有助于推动在嵌入式设备平台的部署.
参考文献
袁亮.煤及共伴生资源精准开采科学问题与对策[J].煤炭学报,2019,44(1):1-9. [百度学术]
YUAN L.Scientific problem and countermeasure for precision mining of coal and associated resources[J].Journal of China Coal Society,2019,44(1):1-9.(in Chinese) [百度学术]
袁亮.煤炭精准开采科学构想[J].煤炭学报,2017,42(1):1-7. [百度学术]
YUAN L.Scientific conception of precision coal mining[J].Journal of China Coal Society,2017,42(1):1-7.(in Chinese) [百度学术]
李良福,马卫飞,李丽,等.基于深度学习的桥梁裂缝检测算法研究[J].自动化学报,2019,45(9):1727-1742. [百度学术]
LI L F,MA W F,LI L,et al.Research on detection algorithm for bridge cracks based on deep learning[J].Acta Automatica Sinica,2019,45(9):1727-1742.(in Chinese) [百度学术]
彭雨诺,刘敏,万智,等.基于改进YOLO的双网络桥梁表观病害快速检测算法[J].自动化学报,2022,48(4):1018-1032. [百度学术]
PENG Y N,LIU M,WAN Z,et al.A dual deep network based on the improved YOLO for fast bridge surface defect detection[J].Acta Automatica Sinica,2022,48(4):1018-1032.(in Chinese) [百度学术]
ZOU Q,ZHANG Z,LI Q Q,et al.DeepCrack:learning hierarchical convolutional features for crack detection[J].IEEE Transactions on Image Processing,2019,28(3):1498-1512. [百度学术]
XU B Q,LIU C.Pavement crack detection algorithm based on generative adversarial network and convolutional neural network under small samples[J].Measurement,2022,196:111219. [百度学术]
KANG D,BENIPAL S S,GOPAL D L,et al.Hybrid pixel-level concrete crack segmentation and quantification across complex backgrounds using deep learning[J].Automation in Construction,2020,118:103291. [百度学术]
HOWARD A G,ZHU M L,CHEN B,et al.MobileNets:efficient convolutional neural networks for mobile vision applications[J].ArXiv e-Prints,2017:arXiv:1704.04861. [百度学术]
CHOLLET F. Xception: deep learning with DSCs[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 1251-1258. [百度学术]
ZHANG X Y, ZHOU X Y, LIN M X, et al. ShuffleNet: an extremely efficient convolutional neural network for mobile devices[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City,UT,USA.IEEE,2018:6848-6856. [百度学术]
HAN K Y. WANG Q. TIAN. GhostNet: more feature from cheap operations[C], 2022, IEEE, CVPR 2020. [百度学术]
蔡逢煌,张岳鑫,黄捷.基于YOLOv3与注意力机制的桥梁表面裂痕检测算法[J].模式识别与人工智能,2020,33(10):926-933. [百度学术]
CAI F H,ZHANG Y X,HUANG J.Bridge surface crack detection algorithm based on YOLOv3 and attention mechanism[J].Pattern Recognition and Artificial Intelligence,2020,33(10):926-933.(in Chinese) [百度学术]
郝巨鸣,杨景玉,韩淑梅,等.引入Ghost模块和ECA的YOLOv4公路路面裂缝检测方法[J]. 计算机应用, 2023, 43(4): 1284-1290. [百度学术]
HAO J M, YANG J Y, HAN S M,et,al. YOLOv4 highway pavement crack detection method introduced by Ghost module and ECA[J]. Computer Application, 2023, 43(4): 1284-1290.(in Chinese) [百度学术]
DOĞAN G,ERGEN B.A new mobile convolutional neural network-based approach for pixel-wise road surface crack detection[J].Measurement,2022,195:111119. [百度学术]
CHENG J R,XIONG W,CHEN W Y,et al.Pixel-level crack detection using U-Net[C]//TENCON 2018-2018 IEEE Region 10 Conference.Jeju,Korea (South): IEEE,2018:462-466. [百度学术]
赵志宏, 何朋, 郝子晔. 一种道路裂缝检测的变尺度VS-UNet模型[J/OL]. 湖南大学学报(自然科学版), 2024: 1-10. [百度学术]
ZHAO Z H, HE P, HAO Z Y. A variable-scale VS-UNet model for road crack detection[J/OL]. Journal of Hunan University (Natural Science Edition),2024: 1-10.(in Chinese) [百度学术]
MEI Q,GUL M,AZIM R.Densely connected deep neural network considering connectivity of pixels for automatic crack detection[J].Automation in Construction,2020,110:103018. [百度学术]
KANG D H,CHA Y J.Efficient attention-based deep encoder and decoder for automatic crack segmentation[J].Structural Health Monitoring,2022,21(5):2190-2205. [百度学术]
CHOI W,CHA Y J.SDDNet:real-time crack segmentation[J].IEEE Transactions on Industrial Electronics,2020,67(9): 8016-8025. [百度学术]
REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once:unified,real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas, NV, USA: IEEE, 2016: 779-788. [百度学术]
REDMON J,FARHADI A.YOLO9000:better,faster,stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Honolulu,HI,USA.IEEE,2017: 6517-6525. [百度学术]
REDMON J,FARHADI A. YOLOv3:an incremental improvement[EB/OL].2018:arXiv:1804.02767.http://arxiv.org/abs/1804. 02767. [百度学术]
BOCHKOVSKIY A,WANG C Y,LIAO H Y M.YOLOv4:optimal speed and accuracy of object detection[EB/OL].2020:arXiv:2004.10934.http://arxiv.org/abs/2004.10934. [百度学术]
JOCHER G. YOLOv5 release v6.1. https://github.com/ ultralytics/yolov5/releases/tag/v6.1, 2022. [百度学术]
WANG Q L,WU B G,ZHU P F,et al.ECA-net:efficient channel attention for deep convolutional neural networks[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).Seattle,WA,USA: IEEE,2020: 11531-11539. [百度学术]
WANG C Y,MARK LIAO H Y,WU Y H,et al.CSPNet:a new backbone that can enhance learning capability of CNN[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).Seattle,WA,USA.IEEE,2020:1571-1580. [百度学术]
HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, NV, USA:IEEE,2016:770-778. [百度学术]
WANG C Y,BOCHKOVSKIY A,LIAO H Y M.Scaled-YOLOv4: scaling cross stage partial network[C]//2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).Nashville,TN,USA: IEEE,2021:13024-13033. [百度学术]
GE Z, LIU S ,WANG F, et al. YOLOX: exceeding YOLO series in 2021[J].2021. [百度学术]
WANG C Y , BOCHKOVSKIY A , LIAO H Y M .YOLOv7: trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[C]. 2023, IEEE, CVPR Vancouver,BC, Canada: IEEE, 2023: 7464-7475. [百度学术]