2025, 52(4):44-56.
摘要:针对复杂背景下航空遥感图像中多类别小尺度目标特征的理解困难和特征边界分割不清晰的问题,本研究构建了一种新型的分割模型,该模型通过综合主干网络特征并进行特征分类与重构来提升分割效果.模型以Swin-Transformer作为基础编码结构,利用其强大的全局语义信息捕捉能力进行特征抽取.进一步,本研究创新性地提出了信息聚合重构模块(IGRM)和通道区分重构模块(CRRM),这两种结构能够依据信息量对抽取的特征进行分类和重构,以此细化了对小尺度目标特征的处理.模型结合了上采样与下采样的特征连接,并将重构特征与编码器特征融合,形成多尺度特征聚合块,进而输出精确的分割结果.在处理复杂背景下的多目标场景时,本模型能够对细小尺度目标特征进行精确重构,生成高分辨率的分割图像,显著提升了分割的准确度.在ISPRS Potsdam和ISPRS Vaihingen数据集上,本模型取得了平均交并比(mIoU)分别为87.15%和82.93%、整体准确率(OA)分别为91.53%和91.4%的优异表现.为评估模型对多类别小尺度目标特征提取的泛化性能,本文还进行了针对复杂背景下小车类别的对比实验,在UAVid数据集上的mIoU达到了67.86%.