摘要
现有的目标检测算法对小型无人机存在难以有效检测、受复杂环境影响以及网络模型复杂等问题,为此提出一种基于YOLOv8的改进型无人机目标检测算法.首先,针对远距离飞行的无人机目标较小的问题,添加一个融合了浅层特征的新的极小目标检测层,同时剔除最大目标检测层,以实现优化目标尺度聚焦并降低网络的复杂度;其次,在Backbone网络中引入GhostConv模块,进一步减少模型的参数量,然后,在Neck网络中融合LSKA模块中的注意力机制,将C2f模块中的Bottleneck用LSKA进行替换,设计全新的C2f-LSKA模块代替Neck中的C2f模块,提高模型对上下文的感知能力和对空间信息的处理能力;最后,采用WIoUv3作为边界损失函数,进一步提高模型精度.实验结果表明,与原模型相比,改进的模型在自建无人机数据集上的精确度P提升了5.0个百分点,召回率R提升了11.9个百分点,mAP@0.5提升了9.5个百分点,改进后的模型参数数量和模型大小分别降低了68.9个百分点和65.1个百分点.
无人机技术的进步和应用范围的扩大已经推动其成为创新应用的前沿领域.无人机在军事、农业、电力、娱乐等诸多领域均已广泛应
近年来,目标识别算法得到了广泛的发展.以检测过程的差异为依据,目标识别算法可以分为两类:多阶段检测与单阶段检
文献[
为了克服传统网络对小型无人机难以识别以及模型尺寸大的问题,本文提出了一种基于改进 YOLOv8n算法的无人机检测模型.主要贡献如下:
1)重新设计YOLOv8的三个检测头,通过融合具有丰富位置信息的P2浅层特征,提高对小型目标的检测精确度,同时剔除了原有的尺度为20×20的大目标检测层,优化目标尺度聚焦并降低了网络的复杂度和计算需求.
2)在骨干网络中引入更为轻量化的Ghostconv模块,减少了模型的参数量,缩减了模型体积.
3)结合LSKA模块与C2f,设计C2f-LSKA模块,代替Neck网络中的部分C2f模块,增强了模型对上下文的感知能力以及对空间信息的处理能力.
4)采用WIoUv3作为边界损失函数,减少了数据集中低质量锚框对训练的影响,增强了模型的定位性能和泛化能力.
1 YOLOv8网络结构
YOLOv8代表了YOLO系列算法的最新进展,通过在之前版本的基础上引入创新和增强功能,显著提高了性能和处理速度.该模型根据不同的缩放系数,提供了N、S、M、L、X五种尺度的变体,以满足各种应用场景的需

图1 YOLOv8网络结构图
Fig.1 YOLOv8 network architecture diagram
在Backbone部分,YOLOv8对CSPDarknet53进行改进用于特征提取.CSPDarknet53的改进在于其优化了网络深度和宽度,有效平衡了模型复杂度和性能,同时减少了计算资源的消耗.通过五次下采样操作,输入图像被转换成P1至P5五个不同尺度的特征层,这些特征层使模型能够有效地检测不同大小的目标.与YOLOv5相比,YOLOv8对网络结构进行了细致的优化,将C3模块升级至C2f结构,该结构通过增加跳跃连接和分割操作,具有更加丰富的梯度流,帮助模型更有效地学习和保留重要的特征信息.Backbone的末端使用了空间金字塔池化模块(SPPF),通过顺序连接三个最大池化层,相较于传统SPP结构,SPPF不仅减少了计算量和处理延迟,还保持了特征的多样性和丰富性.这使得YOLOv8能够更有效地处理各种尺寸的输入特征,提升了模型的适应性和准确性.Neck部分采用PAN-FPN结
2 改进策略研究
2.1 Head部分设计
2.1.1 增加极小分辨率检测头
在原YOLOv8模型中,经过五次下采样操作,图像被转换为五个不同尺度的特征表示(P1、P2、P3、P4、P5),并通过P3、P4、P5层的特征输出,分别对应构建了80×80、40×40和20×20特征尺度的三个检测头.然而,在对飞行中的无人机进行检测的应用场景中,由于无人机与地面之间的相对距离较大,目标尺寸相对较小,经过多次下采样后的无人机特征信息大多数已经丢失,使得原有的三个检测头难以有效捕捉到这些目标.
针对上述问题,本文提出了一种改进策略,即在原有网络架构基础上新增一个特征尺度为160×160的极小目标检测头,以融合P2层提供的更丰富的位置信息.这一改进,显著提升了模型对小型无人机目标的检测能力,有效弥补了原YOLOv8模型在处理极小目标方面的不足.
2.1.2 剔除大目标检测头
针对无人机目标检测和跟踪的特定应用场景,无人机目标在图像中通常呈现为小型或中型对象.鉴于此,保留用于大型目标检测的深层检测层不仅对提升检测效能无益,反而可能因增加计算负荷和引入不必要的干扰而削弱模型性能.因此,本文提出了一种优化方案,即从YOLOv8模型中移除最深层的大目标检测头及其相关的冗余网络部分,使模型更专注于小型和中型无人机目标的有效检测和识别,以便降低模型复杂度,提升处理速度,同时保持目标检测的准确性.
经过本文改进的新型网络架构包括三个检测层:160×160的极小目标检测层、80×80的小目标检测层和40×40的中等目标检测层,以适应无人机目标在图像中的尺寸特点.

图2 Head部分改进效果图
Fig.2 Improved performance of the Head section
2.2 GhostConv模块
GhostCon

图3 GhostConv设计原理
Fig.3 Principle of GhostConv design
假设普通卷积核的大小为,输入特征图的尺寸为,输入特征图的通道数为,输出特征图的通道数为.
可得到整个过程GhostConv卷积计算量如下:
(1) |
(2) |
(3) |
式中:是第一步普通卷积生成一半特征图时的计算量;是通过廉价操作生成另一半特征图时的计算量.
若直接使用普通卷积对特征图进行特征提取,得到与上述相同大小的特征图,整个过程计算量如下:
(4) |
将
(5) |
取卷积核大小为3可以得到,采用GhostConv对目标进行特征提取是普通卷积计算量的55%.
2.3 C2f-LSKA模块
无人机在飞行过程中速度快且飞行轨迹复杂,目标检测结果容易受到复杂背景的干扰以及目标尺度变化的影响.因此,本文引入大型可分离卷积核注意力(LSKA)模

图4 LSKA结构
Fig.4 LSKA architecture
为实现C2f与LSKA模块的融合,本文设计LSKA Attention结构,如

图5 LSKA Attention结构
Fig.5 LSKA Attention structure
本文使用LSKA Attention来替换C2f模块中的Bottlenecks形成全新的C2f-LSKA模块.结构如

图6 C2f-LSKA结构
Fig.6 C2f-LSKA architecture
2.4 损失函数改进
合理设计损失函数可以提高网络模型的检测性能,YOLOv8原模型使用DFL+CIoU计算,CIoU通过考虑中心点距离以及预测框和真实框的重叠区域等因素来优化边界框预测.但在实际应用中,CIoU损失在处理小目标检测时存在几个不足之处:首先,对于小目标,IoU的微小变化对检测灵敏度的影响不如大目标明显,导致CIoU损失对小目标的检测不够敏感;其次,虽然CIoU考虑到了长宽比,但其对某些特定形状和长宽比变化的敏感度不足;最后,CIoU中的平衡因子是固定的,不适应所有类型目标,尤其是尺寸变化较大的目标.其表达式如式(6)~
(6) |
(7) |
(8) |
式中涉及的一些参数定义如

图7 损失函数参数示意图
Fig.7 Loss function parameter diagram
本文采用Wise-IoU损失函
(9) |
(10) |
(11) |
式中:为锚框的离群度,离群度越小表示锚框质量越高;为非单调聚焦系数,减小低质量锚框对训练的干扰;为超参数,以调整的影响;和分别为预测框和真实框的中心坐标;和分别为包含真实框和预测框最小闭合区域的宽度和高度;表示预测框和真实框不相交部分的面积;为当前锚框的IoU损失;为均值IoU损失.
综上所述,本文对YOLOv8网络的骨干、颈部和头部均作了改进.改进后的网络结构如

图8 改进YOLOv8网络结构图
Fig.8 Improved YOLOv8 network architecture diagram
3 实验及结果分析
3.1 实验数据集
由于对无人机检测的应用较少,还没有标准的官方数据集,因此本文所采用的数据集是在互联网上找到的2 873张无人机图像,格式为JPG格式,并使用roboflow对图像进行标注后一一生成对应的TXT标签文件.标签数据按照7∶3的比例划分为训练集和验证集,数据集存储的格式结构基于VOC2007创建,数据集包括无人机飞行的多个使用场景,部分数据集图片如

图9 部分无人机数据集
Fig.9 Partial UAV dataset
3.2 实验环境设置
本文实验训练模型使用的硬件平台和环境参数设置如
名称 | 配置 |
---|---|
操作系统 | Linux |
开发环境 | CUDA 11.1 |
处理器(CPU) | Intel(R) Xeon(R) Platinum 8255C CPU @ 2.50GHz |
显卡(GPU) | RTX 2080 Ti(11GB) |
epochs | 150 |
batch-size | 8 |
3.3 评价指标
为了检测本文提出的改进模型的性能,本实验采用精确率P、召回率R、平均精度均值mAP@0.5、模型参数数量、模型体积和每秒帧数FPS作为评估指标.其中精确率是衡量检测到正类中实际为正类的比例,计算公式如
(12) |
式中:TP为真正类,即正确检测到的目标数;FP是假正类,即错误标记为目标的数.
召回率是衡量所有正类中被正确检测到的比例,计算公式如
(13) |
式中:FN是假负类,即漏检的目标数.
mAP是多个类别平均精确度的平均值,在不同的召回率阶段计算精确度,然后取平均值.在mAP@0.5中,只有当IoU(交并比)大于0.5时,检测才被视为正确.对比mAP@0.5:0.95为IoU阈值在0.5到0.95之间逐步增加时的平均精度,本文的研究对象是对小型无人机的检测,其边界框的IoU值较小,因此选取mAP@0.5作为评价指标以保证检测的灵活性.AP是衡量在所有不同的召回率阈值下,精确率的平均值,计算公式如
(14) |
mAP的计算公式如
(15) |
式中:N是类别的数量,是第i个类别的平均精确度.
3.4 测试结果与分析
3.4.1 消融实验
为了验证每个改进模块的优化效果,本文基于自建数据集设计并进行了消融实验.为了进一步评估改进的技术对YOLOv8n算法的影响,以YOLOv8n为初始实验模型一,依次对网络的各个部分以及损失函数进行改进得到六个改进模型,分别对这七种模型进行定量研究,实验结果如
模型 编号 | +Tiny Head | -Large Head | GhostConv | C2f-LSKA | WIoUv3 | P/% | R/% | mAP@0.5/% | Parameters | Model size/MB | FPS/(帧· |
---|---|---|---|---|---|---|---|---|---|---|---|
一 | × | × | × | × | × | 87.4 | 79.1 | 84.5 | 3 005 843 | 6.3 | 129.87 |
二 | √ | × | × | × | × | 89.3 | 88.7 | 92.5 | 2 977 588 | 6.3 | 114.94 |
三 | √ | √ | × | × | × | 87.3 | 87.6 | 91.1 | 1 040 467 | 2.4 | 129.87 |
四 | √ | √ | √ | × | × | 89.9 | 89.7 | 92.9 | 996 787 | 2.3 | 113.63 |
五 | √ | √ | × | √ | × | 89.8 | 88.5 | 92.3 | 980 371 | 2.3 | 112.36 |
六 | √ | √ | √ | √ | × | 91.5 | 89.2 | 92.9 | 934 787 | 2.2 | 128.20 |
七 | √ | √ | √ | √ | √ | 92.4 | 91.0 | 94.0 | 934 787 | 2.2 | 126.58 |

图10 YOLOv8n与改进模型实验对比图
Fig.10 Comparison graph of YOLOv8n and improved model experiments

(a) 精确率P对比

(b) mAP@0.5对比
图11 YOLOv8n与改进模型训练过程对比图
Fig.11 Comparison graph of training processes between
YOLOv8n and the improved model
为了更加直观地观察改进模型的检测效果,将基础模型YOLOv8n和本文改进的模型用于无人机的检测,并将两者检测的效果图进行对比,如

(a)
(b)
(c)

(d)
(e)
(f)
图12 简单背景下的检测效果对比图
Fig.12 Detection performance comparison graph in simple background

(a)
(b)
(c)

(d)
(e)
(f)
图13 复杂背景下的检测效果对比图
Fig.13 Detection performance comparison graph in complex background

(a)
(b)
(c)

(d)
(e)
(f)
图14 极小目标下的检测效果对比图
Fig.14 Detection performance comparison graph for tiny objects
3.4.2 对比实验
为了进一步证明本文所提算法的有效性和优越性,将本文改进后的模型分别与当前其他热门算法在本文自建数据集上进行对比实验,采用平均精度均值mAP@0.5、模型参数数量、模型体积和每秒帧数FPS作为评估指标,它们已经被广泛用于各种嵌入式场景并发表在许多论文中,其中所使用的所有算法均为官方正式版,为了确保公平性,所有的模型都没有使用预先训练的权重进行训练,比较实验的结果见
Models | mAP@0.5/% | Parameters | Model size/MB | FPS/ (帧· |
---|---|---|---|---|
Faster R-CNN | 90.1 | 47 267 456 | 180.7 | 17.45 |
SSD | 73.7 | 23 745 908 | 90.6 | 17.53 |
YOLOv3-tiny | 74.0 | 12 128 178 | 24.4 | 169.49 |
YOLOv5n | 82.4 | 2 503 139 | 5.3 | 125.00 |
YOLOv6n | 83.7 | 4 233 843 | 8.7 | 142.85 |
YOLOv8n | 84.5 | 3 005 843 | 6.3 | 129.87 |
Ours | 94.0 | 934 787 | 2.2 | 126.58 |
4 结 论
本文提出一种基于改进YOLOv8n的小型无人机目标检测算法.首先,在原模型三个检测层的基础上再添加一个新的极小目标检测层,同时剔除最大目标检测层,提高网络对小型无人机检测精度的同时降低模型复杂度;其次,引入更为轻量化的GhostConv模块,缩减模型体积;然后,在颈部网络中设计全新的C2f-LSKA模块代替部分C2f模块,提高模型对上下文的感知能力和对空间信息的处理能力;最后,采用WIoUv3作为边界损失函数,提高训练时的收敛速度和回归精度.实验结果表明,与原模型相比,改进的模型在自建无人机数据集上的P提升了5.0个百分点,R提升了11.9个百分点,mAP@0.5提升了9.5个百分点,参数量减少了68.9个百分点,模型体积压缩了65.1个百分点.在提高检测精度的同时大幅度降低了模型的复杂度和模型体积,且对复杂环境下的目标具有更好的检测效果.本文的工作主要集中在提高无人机在各种环境下的识别和定位能力,后续工作将检致力于提高在更复杂空域背景下的探测精度,并对无人机飞行轨迹进行预测实现对无人机的实时追踪.
参考文献
黄开.激光供能技术在无人机续航中的应用研究[D].宜昌:三峡大学,2020. [百度学术]
HUANG K.Research on the application of laser energy supply technology in the endurance of UAV[D].Yichang:China Three Gorges University,2020.(in Chinese) [百度学术]
彭艺,涂馨月,杨青青,等.基于改进YOLOv5的轻量化无人机检测算法[J].湖南大学学报(自然科学版),2023,50(12):28-38. [百度学术]
PENG Y,TU X Y,YANG Q Q,et al.Lightweight UAV detection algorithm based on improved YOLOv5[J].Journal of Hunan University (Natural Sciences),2023,50(12):28-38.(in Chinese) [百度学术]
JURN Y N,MAHMOOD S A,ALDHAIBANI J A.Anti-drone system based different technologies:architecture,threats and challenges[C]//2021 11th IEEE International Conference on Control System,Computing and Engineering (ICCSCE). Penang,Malaysia.IEEE,2021:114-119. [百度学术]
OUYANG J,CHE Y L,XU J,et al.Throughput maximization for laser-powered UAV wireless communication systems[C]//2018 IEEE International Conference on Communications Workshops (ICC Workshops). Kansas City,MO,USA.IEEE,2018:1-6. [百度学术]
ZHAO M M,SHI Q J,ZHAO M J.Efficiency maximization for UAV-enabled mobile relaying systems with laser charging[J].IEEE Transactions on Wireless Communications,2020,19(5):3257-3272. [百度学术]
MOLCHANOV P,EGIAZARIAN K,ASTOLA J,et al.Classification of small UAVs and birds by micro-Doppler signatures[C]//2013 European Radar Conference. Nuremberg,Germany.IEEE,2013:172-175. [百度学术]
BASAK S,RAJENDRAN S,POLLIN S,et al.Combined RF-based drone detection and classification[J].IEEE Transactions on Cognitive Communications and Networking,2022,8(1):111-120. [百度学术]
JIAO L C,ZHANG F,LIU F, et al. A survey of deep learning-based object detection[J]. IEEE Access, 2019, 7: 128837-128868. [百度学术]
GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus,OH,USA. IEEE,2014:580-587. [百度学术]
GIRSHICK R. Fast R-CNN[C]//2015 IEEE International Conference on Computer Vision (ICCV). Santiago, Chile. IEEE,2015: 1440-1448. [百度学术]
MAI X C, ZHANG H, JIA X, et al. Faster R-CNN with classifier fusion for automatic detection of small fruits[J]. IEEE Transactions on Automation Science and Engineering, 2020, 17(3): 1555-1569. [百度学术]
REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once:unified,real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, NV, USA. IEEE, 2016: 779-788. [百度学术]
KUMAR A,ZHANG Z J,LYU H B.Object detection in real time based on improved single shot multi-box detector algorithm[J].EURASIP Journal on Wireless Communications and Networking,2020, 2020(1): 204. [百度学术]
LIN T Y,GOYAL P, GIRSHICK R, et al. Focal loss for dense object detection[C]//2017 IEEE International Conference on Computer Vision (ICCV). Venice, Italy. IEEE, 2017:2999-3007. [百度学术]
SHI Q B, LI J. Objects detection of UAV for anti-UAV based on YOLOv4[C]//2020 IEEE 2nd International Conference on Civil Aviation Safety and Information Technology (ICCASIT. Weihai,China.IEEE,2020:1048-1052. [百度学术]
DING Y X,QU Y C,ZHANG Q, et al. Research on UAV detection technology of gm-APD lidar based on YOLO model[C]//2021 IEEE International Conference on Unmanned Systems (ICUS). Beijing, China. IEEE, 2021: 105-109. [百度学术]
FARAJI H, CHEN B C. Drone-YOLO: improved YOLO for small object detection in UAV[C]//2023 8th International Conference on Image,Vision and Computing (ICIVC). Dalian, China. IEEE,2023: 93-100. [百度学术]
MA J,WANG X,XU C F,et al.SF-YOLOv5:Improved YOLOv5 with swin transformer and fusion-concat method for multi-UAV detection[J].Measurement and Control,2023,56(7/8):1436-1445. [百度学术]
ZHAI X X,HUANG Z H,LI T,et al.YOLO-drone: an optimized YOLOv8 network for tiny UAV object detection[J].Electronics,2023, 12(17): 3664. [百度学术]
WANG G,CHEN Y F,AN P,et al.UAV-YOLOv8:a small-object-detection model based on improved YOLOv8 for UAV aerial photography scenarios[J].Sensors, 2023, 23(16): 7190. [百度学术]
熊恩杰,张荣芬,刘宇红,等.面向交通标志的Ghost-YOLOv8检测算法[J].计算机工程与应用, 2023, 59(20): 200-207. [百度学术]
XIONG E J,ZHANG R F, LIU Y H, et al. Ghost-YOLOv8 detection algorithm for traffic signs[J]. Computer Engineering and Applications, 2023, 59(20): 200-207.(in Chinese) [百度学术]
HU J F, SUN J X, LIN Z H, et al. APANet: auto-path aggregation for future instance segmentation prediction[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022, 44(7):3386-3403. [百度学术]
HAN K,WANG Y H,TIAN Q,et al.GhostNet:more features from cheap operations[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle,WA,USA.IEEE,2020:1580-1589. [百度学术]
LAU K W, PO L M, REHMAN Y A U. Large separable kernel attention:rethinking the large kernel attention design in CNN[J].Expert Systems with Applications,2024,236:121352. [百度学术]
TONG Z J,CHEN Y H,XU Z W,et al.Wise-IoU: bounding box regression loss with dynamic focusing mechanism[EB/OL]. 2023:2301.10051.https://arxiv.org/abs/2301.10051v3. [百度学术]