+高级检索
网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于滤波器剪枝的多尺度压缩感知图像重构  PDF

  • 刘玉红
  • 姜启
  • 谈丽娟
  • 杨恒
兰州交通大学 电子与信息工程学院,甘肃 兰州 730070

中图分类号: TP391.4

最近更新:2024-08-25

DOI: 10.16339/j.cnki.hdxbzkb.2024276

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

为了解决低采样率下单尺度采样的压缩感知重构图像纹理细节模糊问题,同时达到使重构网络轻量化的目的,提出了一种基于滤波器剪枝的多尺度压缩感知图像重构网络.采样阶段,通过卷积来模拟图像的线性分解,融合输入图像和不同尺度的分解特征后完成多尺度采样,得到压缩感知测量值.重构阶段,设计了一种基于坐标注意力的多尺度空洞残差模块,将位置信息嵌入通道注意力中,增强网络特征学习的能力.同时通过计算特征图的熵来判断滤波器的重要性,剪除重要性较低的滤波器,达到压缩模型的目的.在DIV2K、Set5、BSDS68和Urban100等数据集上进行训练及测试.实验结果表明,所提算法在峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)、结构相似性(Structural Similarity, SSIM)和图像视觉效果上均有提升.其中,采样率为4%,测试集为Set14时,与CSNet+和FSOINet相比,所提算法将重构图像的PSNR分别提高了4.17 dB和2.39 dB,纹理细节更加清晰.在重构效果略微降低的前提下,得到更轻量化的模型,提升了重构速度.

压缩感知(Compressed Sensing, CS)理

1-2表明,当信号在某个域中是可压缩或稀疏时,通过采样矩阵对信号进行压缩采样,得到CS测量值,最后通过非线性优化问题的求解重构出原始信3.压缩感知在对信号采样的同时完成压缩,大大减少了信号采样端的资源浪4,提高了传输效率,在快速压缩成5、无线传感器通6、成像技7等领域得到成功应用.

早期的研究者假设原始图像信号具有lp范数0p1稀疏性,提出了一些迭代算法,例如:匹配追踪算

8、迭代硬阈值算9、梯度投影算10等.然而这些重构算法的计算复杂度高,重构时间长,低采样率下的重构质量差.

由于深度学习有极强的学习能力和极快的运行速度,近年来被广泛应用于压缩感知图像重构领域.Mousavi

11提出堆叠式去噪自动编码器(SDA),首次将压缩感知与深度学习结合,通过捕获图像信号不同元素之间的统计相关性,将SDA应用于CS重构.很多基于卷积神经网络(Convolutional Neural Network, CNN)的CS图像重构网络被提出,与传统的CS重构算法相比具有明显的优12-13.Kulkarni14提出了一种非迭代重建网络ReconNet,该网络使用固定的随机高斯矩阵获取图像采样数据,用卷积神经网络学习CS测量到原始图像的映射.Shi15提出一种基于卷积神经网络的图像CS框架CSNet,对其中的采样网络和重构网络进行了联合优化.在CSNet的基础上,Cui16提出了一种基于非局部神经网络的图像重构网络NL-CSNet,利用测量域和多尺度特征域中的非局部自相似先验信息,构造了两个非局部子网.上述网络能够有效提高重构图像的质量,但均使用单尺度采样,没有考虑图像的多尺度特征.另一个压缩感知图像重构的研究方向是结合传统的图像先验和深度学习方法,Zhang17提出了可解释性强且性能良好的结构化深层网络ISTA-Net.然而,由于其随机采样和逐块重构的方式,重构性能受到限制.随后,受优化启发的思想,Zhang18提出了端到端的深度重构网络OPINE-Net,由采样子网、初始化子网和重构子网组成,进行自适应采样和图像重构.为了能充分利用图像特征中的信息,Chen19设计了特征空间优化启发网络FSOINet,通过将近端梯度下降算法的两个步骤从像素空间映射到特征空间来实现图像重构.这些方法将迭代优化器展开到网络上,具有很好的可解释性.

尽管基于CNN的方法已经取得了相当大的改进,但现有的方法仍有许多缺点.基于CNN的方法引入了更大的规模和更多的网络参数,这是在资源受限和实时系统环境中开发的一个障

20.Denil21的研究表明,许多深度神经网络的参数具有显著的冗余性,只需要少量的参数就可以预测所有剩余的参数.在最好的情况下,可以预测网络95%以上的权值,而不降低模型准确度.因此,去除冗余参数进行模型压缩成了一种可行的解决方案.深度神经网络在使用阶段的主要资源可分为计算资源和存储资源.在使用过程中,大部分计算存在于卷积层和全连接层.然而,根据Yang22的工作,卷积层贡献了大约90%的计算量.因此,修剪全连接层不能有效地减少计算冗余.

因此,本文提出一种基于滤波器剪枝的多尺度压缩感知图像重构网络,主要创新如下.

1)采样阶段,提出多尺度融合采样,通过卷积模拟图像的线性分解,融合输入图像和不同尺度的分解特征后,进行多尺度采样得到压缩感知测量值,使采样子网络学习到更加丰富的多尺度特征.

2)重构阶段,提出一种基于坐标注意力的多尺度空洞残差模块,可提取到不同尺度的图像特征.引入坐标注意力,将精确的位置信息嵌入通道注意力中,对通道关系和长距离依赖进行编码,增强网络特征学习的能力.

3)为了降低模型的参数量和存储空间,对较复杂的深度特征提取模块进行了模型剪枝,通过计算输出特征图的熵来判别每一个滤波器的重要性,剪除掉重要性低的滤波器,达到压缩模型的目的.

1 相关工作

1.1 多尺度压缩感知

在原始图像和多级分解域中获取图像特征分别称为单尺度采样和多尺度采样.许多研究已经充分表明多尺度采样比单尺度采样更有优

23-27,但是目前大多数压缩感知还是使用单尺度采样.通过研究发现,单尺度矩25模拟了传统的多尺度采样,以捕获更多的低频分量,但会导致重构图像出现混叠伪影.Canh23为Kronecker CS开发了多尺度采样,通过小波、金字塔或多分辨率分解将图像分解成不同尺度的特征,并自适应地对每个尺度进行采样.Shi26提出了一种多尺度深度网络,该网络使用相同的深度重构网络从不同采样率的测量中恢复图像,这大大降低了存储需求.Wang27提出了一种基于多尺度采样的深度重构网络,该网络使用不同大小的卷积核对输入图像线性分解后,采样子网络捕获每个尺度上的特征得到压缩感知测量值,作为重构子网络的输入.研究发现,在压缩感知采样时,低频分量比高频分量更为重24.因此,利用多尺度信息能增强网络特征学习的能力,采样后得到包含更多特征的压缩感知测量值并提升最终图像的重构质量.

1.2 滤波器剪枝

Tu

28研究表明,卷积神经网络中许多神经元的输出值非常低,可以在不损害整体性能的情况下对冗余的弱神经元进行修剪.模型压缩方法主要分为网络剪枝、参数量化、知识蒸馏、低秩分解和紧凑型网络设计29.网络剪枝分为非结构化剪枝和结构化剪枝.非结构化剪枝是将不重要的权值设置为0,从而实现高稀疏性,但是稀疏操作需要专门的硬件或者软件库来加快推理过程,因此限制了非结构化剪枝的应30.结构化剪枝则是根据一种评判机制来剪除不重要的滤波器,降低模型的参数量和计算31.Li32提出了一种基于l1范数准则判别滤波器的重要性的压缩方法,剔除重要性低的滤波器.He33提出一种渐进软滤波器剪枝方法来加速深层神经网络,从零开始训练并且完成修剪,剪枝后的模型的优化空间没有减少,使模型有足够的能力从训练数据中学习.Wang34提出一种根据特征图的熵来定义滤波器的重要性的卷积神经网络压缩方法,删除了当前层和对应下一层的滤波器,降低了模型的计算和存储成本.

2 本文方法

本文所提剪枝前的网络为多尺度融合的坐标注意力网络(Multi-scale Fusion Coordinate Attention Network, MFCANet),如图1所示,主要由多尺度融合采样子网络、初始重构子网络和深度重构子网络组成,如下所述.

fig

图1  MFCANet网络结构

Fig.1  MFCANet network structure

2.1 多尺度融合采样和初始重构

传统的多尺度采样首先将图像分解为不同尺度的子图像,然后获取各个尺度上的测量值.由于每个尺度的图像具有不同程度的稀疏性,因此其测量数量是启发式分

35的,限制了最终重构性能.为了扩大卷积核的感受野,同时降低模型训练的难度,本文使用大小为3×3,空洞值分别为1、2、3、4的卷积核来模拟线性分解,可得到不同尺度的分解特征,如式(1)所示:

xl=Clx (1)

式中:x表示原始图像;Clll,,m表示卷积核,m表示卷积核的总个数,本文取m=4xl表示第l个图像分解特征.

对大小为n×n的输入图像x线性分解得到四路不同尺度的特征,采用Concat方式将相邻两路的分解特征进行融合.因为连续采用空洞卷积时,一些像素不参与计算,将会产生网格化效

36.所以通过3×3、5×5、7×7大小的卷积核进一步提取融合后的特征信息.最后将x和三路特征用Concat方式再融合,得到λ=4个待采样的图像,在图1中多尺度融合采样阶段可见.单尺度采样时,采样率为MN时,采样矩阵ΦB可以得到nB=MNB2个CS测量值,其B=32.为了保持与单尺度相同的采样率,本文采用全卷积来模拟压缩感知采样过程,选择大小为B2×B2,步长为B2的卷积核进行不重叠采样.MN=0.1时,得到nB=MNλB22=102个压缩感知测量值.由此,可以得到多尺度压缩感知测量值y,表示为:

y=Nms*xc (2)

式中:*表示卷积运算;Nms表示大小为B2×B2nB个卷积核;xc表示Concat融合后的特征.

在采样率为0.01时,得到10个CS测量值,将每个测量值通过双线性插

37的上采样方式进行可视化,如图2所示.与单尺度采样相比,所提的多尺度融合采样能提取到更丰富的特征用于重构.

fig

图2  压缩感知测量值的可视化

Fig.2  Visualization of compressed sensing measurements

在得到压缩感知测量值后,图像的分辨率和大小都被压缩,为了能准确地重构出图像信息,通过反卷积(Deconv

38方式将维度提升到原始图像的大小,并生成初始重构图像.反卷积的卷积核大小为B2×B2,步长为B2.反卷积操作首先将零添加到测量图像以将其维数扩展到原始图像的大小,然后将全卷积测量中的卷积核转置后对零填充测量图像进行卷积运算.反卷积相当于卷积的逆过程,反卷积可以用作上采样,将维数提高到原始图像大小,为后续深度重构做准备.

2.2 深度重构

本文深度重构子网络由浅层特征提取、深层特征提取和多尺度去噪模块(Multi-scale Denoising Module, MDM)三部分组成,如图1所示.

2.2.1 浅层特征提取

为了扩大卷积核的感受野,首先使用了大小为3×3,空洞值为3的128个卷积核对初始重构图像提取高维特征.然后使用3×3卷积来降低通道数.为了引导网络能向含有丰富特征的图像区域学习,引入坐标注意力(Coordinate Attention, CA

39,如图3所示.最后通过3×3卷积层将注意力加权后的图像特征输出到深度特征提取部分.

fig

图3  坐标注意力机制结构图

Fig.3  Structure diagram of coordinate attention mechanism

在计算能力有限的情况下,计算资源分配给更重要的任务,同时解决信息超载的问题,视觉注意力机制已被证明可承担各种计算机视觉任

40,如图像重建、语义分割和目标检测等,其能使网络定位到更感兴趣的图像特征.本文引入的坐标注意力包括坐标信息嵌入和坐标注意力生成,将位置信息嵌入通道注意中,不仅能捕获跨通道信息,还能捕获方向感知和位置敏感信息.

坐标信息嵌入部分如图3中I所示,对于输入Pi,j,使用H,11,W的池核将全局池化分别沿着水平L和竖直V坐标方向分解为一个一维特征编码对.

坐标注意力生成部分如图3中II所示,首先将坐标信息嵌入部分生成的两路特征图级联,然后发送到大小为1×1卷积的变换函数F1中,F1变换得到空间信息在水平方向和垂直方向上编码的中间特征图fRC/r×H+Wr为缩放系数,其用来控制通道数.然后从空间维度将f分解成两个独立的张量fhRC/r×HfwRC/r×W.两个1×1卷积变换FhFw分别用于将fhfw变换为与输入特征具有相同通道数的张量,然后通过Sigmoid函数分别输出ghgw用作注意力权重.最终的输出Qi,j为:

Qi,j=Pi,j×ghi×gwj (3)

2.2.2 深层特征提取

为了提取不同感受野下的特征信息,本文提出了多尺度空洞残差块(Multi-scale Dilated Residuals Block, MDRB),也引入了坐标注意力机制,如图4所示.MDRB的数量为6,MDRB包含两部分:多尺度特征融合和局部残差学习.

fig

图4  多尺度空洞残差块

Fig.4  Multi-scale dilated residual block

1)多尺度特征融合:第一层由三条支路分别使用空洞值为1、2、3的3×3卷积来提取特征,空洞卷积在保持较大感受野的同时,能减少网络参数,降低计算复杂度.将三路不同尺度的特征进行融合,实现旁路之间的信息共享,从而能够检测到不同尺度上图像的特征.将融合后的特征通过坐标注意力加权后输入第二层卷积层中,完成和第一层同样的操作.同理,第三层再融合第二层输出的融合特征,最后使用1×1卷积进行降维.

2)局部残差学习:为了提升网络提取特征的效率,本文通过一个快捷连接对多尺度特征采用局部残差学习,可描述为:

Xn=S+Xn-1 (4)

式中:Xn-1Xn分别为MDRB的输入和输出;S表示输出的图像特征.

随着网络的不断加深,网络的空间表达能力逐渐下降,为了能充分利用不同层的特征,对每个MDRB也采用局部残差学习,可以融合不同层的特征,降低网络的计算复杂度,提高了网络训练时的收敛速度.

2.2.3 多尺度去噪模块

本文在初始重构和深度重构之间添加了一个长跳跃连接,能加快网络收敛速度,但是初始重构图像含有较多不同尺度的噪声,为此提出了多尺度去噪模块(Multi-scale Denoising Module, MDM),如图5所示.

fig

图5  多尺度去噪模块

Fig.5  Multi-scale denoising module

首先通过3×3卷积对初始重构图像进行滤波,然后将通道按照顺序划分为三等分,不同卷积核用分层残差的形式连接,最后通过1×1卷积融合三路多尺度特征,整个模块做残差连接处理.分割和融合策略使得卷积能够更有效地处理特

38,MDM内部及残差连接的具体操作可定义为:

Xk=X1+X2+X3 (5)
Y1=X1*3×3 (6)
Y2=X2+Y1*3×3 (7)
Y3=X3+Y2*3×3 (8)
X'=X+Y (9)

式中:*表示卷积运算;Y1Y2Y3分别得到与标准卷积3×3、5×5和7×7相同的感受野.

2.3 基于特征图熵准则的滤波器剪枝

为了能在资源有限的设备上部署MFCANet,采用滤波器生成的特征图的信息熵来作为修剪滤波器的依据.本文主要修剪比较复杂的MDRB模块,减少网络模型的参数量和重构时间.

2.3.1 剪枝准则

在信息论中,通常用信息熵来衡量信息的总量,计算公式如式(10)所示:

HX=-i=1npilog2pi (10)

式中:X表示图像灰度值的离散随机变量,其概率分布可表示为:

PX=xi=pi,i=1,2,,n (11)

如果X是一幅图像,随着HX值的增加,该图像包含更多的信息.本文通过式(12)式(13)

41来计算图像的二维熵.

Ei,j=-k=0255c=0255pk,clog2pk,c,1iNL,1jNi+1 (12)
pk,c=s=1Mlt=1MwHi,j[s][t]*111101111==k,cMl×Mw (13)

式中:采用3×3的均值滤波器计算中心像素邻域的均值.Ei,j表示第i层的第j个滤波器输出特征图的熵值;NL表示卷积层总数;Ni+1表示每一层的滤波器总数;MlMw分别表示输出特征图的长度与宽度;pk,c表示像素对k,c在特征图中出现的频数,像素对k,c表示中心像素为k,3×3邻域像素均值为c的区域.

2.3.2 剪枝过程

为了能够更直观地理解MDRB模块剪枝过程中各支路输出通道数的变化情况,如图6所示,图中剪枝后的输出通道数以颜色标出.

fig

图6  剪枝率为50%时MDRB的通道数变化过程

Fig.6  The changing process of the number of channels in MDRB with a pruning rate of 50%

本文设定第i层的滤波器Fi=f1i,f2i,,fji,剪枝过程如下:首先将批量测试图像输入MFCANet中,由式(12)式(13)计算得到第i层每个滤波器生成的特征图的熵,形成熵值的集合Ei

Ei=e1i,e2i,,eji (14)

其次,按照升序对熵集进行重新排序,得到E^i

E^i=eI1ii,eI2ii,,eIjii (15)

式中:IjiEi中的第j个最大熵值的索引.

再次,根据剪枝率j'/jj'<j确定需要剪除的特征图集合E˜i

E˜i=eI1ii,eI2ii,,eIj'ii (16)

最后,根据需要剪除的特征图的索引得到重要性较低的滤波器集F˜i

F˜i=fI1ii,fI2ii,,fIj'ii (17)

通过移除集合F˜i,完成滤波器的修剪,达到压缩模型的目的.将MDRB模块进行剪枝后得到轻量化的MFCANet.

3 实验结果与分析

3.1 实验平台及训练

本文实验在深度学习框架Pytorch上完成.计算 机配备Intel(R) Xeon(R) CPU E5-2686 v4和Nvidia GeForce GTX 3060 GPU,网络框架运行在Windows10操作系统上.数据集使用了DIV2K

42的800张训练数据集和100张验证集,并且在Set515、Set1114、Set1416、BSDS6817和Urban10019等数据4上进行测试与对比实验.为了增加训练数据集的图像样本,采用常用的数据增强方法,如:随机裁剪256×256大小的图像、水平翻转、垂直翻转和旋转等.

模型训练时采用Adam优化器对模型参数进行优化,初始动量设置为0.9,每一次迭代的批次大小设置为4,权重衰减为1×10-5,初始学习率为0.000 02,每50轮学习率降低2倍,训练轮数设置为200,激活函数采用PReLu.采用均方误差(Mean Square Error, MSE)作为损失函数,如式(18)所示:

Lθ=min12Κi=1Κfxi',θ-xi'F2 (18)

式中:Κ表示训练图像的数量;xi'表示训练图像;fxi',θ表示重构图像;θ表示训练的参数.

3.2 评价指标

本文采用峰值噪声比(PSNR)、结构相似性(SSIM)及视觉效果来评价压缩感知重构图像的性能.PSNR是常用的客观评价指标,计算公式为:

PSNR=10lg255×255Lθ (19)

SSIM用于评估图像重构的结构性能.SSIM在图像相似性评价指标上更先进,能够进一步反映出算法重构图像的质量.结构相似性的值越接近1,说明两幅图像越相似.对于输入图像X和重构图像Y,可以通过式(20)计算两个图像的结构相似性:

SSIM=2μXμY+c12σXY+c2μX2+μY2+c1σX2+σY2+c2 (20)

式中:μXμY分别表示图像XY的平均值;σXσY分别表示图像XY的标准差;σXY表示图像XY之间的协方差;c1c2表示常数.

3.3 与现有重构算法的性能对比

本文选取1%、4%、10%和25%四种采样率进行实验,将所提算法与ReconNet

14、CSNet+[15]、ISTA-Net+[17]、OPINE-Net+[18]、FSOINet19、MDCS-Net27和ISTA-Net++[43]在PSNR、SSIM和视觉效果三个方面进行比较.

表1所示,本文对比了不同采样率下各个算法重构图像的PSNR和SSIM平均值,以粗体标记了最佳结果,下画线标记了次最佳结果.在采样率为4%,测试集为Set14时,与ISTA-Net+、CSNet+、MDCS-Net、FSOINet相比,本文可将PSNR/SSIM平均值分别提高6.46 dB/0.282 8、4.17 dB/0.171 7、4.06 dB/0.168 3、2.39 dB/0.119 6.为了验证本文所提算法的泛化性能,还在BSDS68和Urban100数据集上进行了对比实验,结果显示本文所提算法的重构图像PSNR和SSIM均优于其他六种对比算法.

表1  各采样率下不同算法在不同数据集上重构图像的平均PSNR(dB)/SSIM对比
Tab.1  Comparison of average PSNR(dB)/SSIM of reconstructed images on different datasets using different algorithms at different sampling rates
数据集算法采样率/%平均值
141025
Set14 ISTA-Net+ 18.15/0.398 5 21.96/0.568 0 25.94/0.728 3 30.59/0.870 7 24.16/0.641 4
CSNet+ 20.80/0.532 3 24.25/0.679 1 26.70/0.781 1 30.10/0.882 4 25.46/0.718 7
OPINE-Net+ 21.19/0.522 1 25.45/0.711 6 28.72/0.829 7 33.08/0.920 2 27.11/0.745 9
ISTA-Net++ 21.58/0.576 8 24.82/0.688 9 27.28/0.771 6 32.01/0.889 4 26.42/0.731 7
MDCS-Net 20.81/0.538 7 24.36/0.682 5 27.28/0.805 3 31.44/0.908 8 25.97/0.733 8
FSOINet 22.07/0.553 3 26.03/0.731 2 29.30/0.844 5 33.99/0.930 9 27.85/0.765 0
MFCANet 24.09/0.678 1 28.42/0.850 8 33.50/0.940 9 40.93/0.986 1 31.74/0.864 0
BSDS68 ISTA-Net+ 19.35/0.422 0 22.33/0.556 6 25.30/0.700 3 29.32/0.851 0 24.08/0.632 5
CSNet+ 21.61/0.535 0 24.35/0.659 3 26.40/0.760 0 29.33/0.869 8 25.42/0.706 0
OPINE-Net+ 21.89/0.516 3 25.16/0.684 4 27.81/0.804 4 31.51/0.906 4 26.59/0.727 9
ISTA-Net++ 21.97/0.534 1 24.46/0.663 7 26.39/0.742 0 30.25/0.872 8 25.77/0.703 2
MDCS-Net 21.68/0.539 4 24.45/0.664 8 27.01/0.784 5 30.67/0.898 9 25.95/0.721 9
FSOINet 22.80/0.543 6 25.63/0.702 7 28.28/0.819 4 32.20/0.918 5 27.23/0.746 1
MFCANet 24.24/0.658 4 27.96/0.832 5 32.61/0.938 3 41.18/0.991 2 31.50/0.855 1
Urban100 ISTA-Net+ 16.16/0.315 5 18.86/0.489 5 22.54/0.697 8 28.22/0.887 5 21.45/0.597 6
CSNet+ 18.42/0.416 8 21.18/0.599 1 23.45/0.735 8 26.90/ 0.868 3 22.49/0.655 0
OPINE-Net+ 18.54/0.416 0 22.01/0.664 8 25.71/0.828 9 30.93/ 0.935 2 24.30/0.711 2
ISTA-Net++ 18.77/0.518 0 21.51/0.653 8 24.42/0.772 4 30.13/ 0.916 7 23.71/0.715 2
MDCS-Net 18.41/0.425 8 21.26/0.603 7 24.19/0.775 1 28.52/0.905 5 23.10/0.677 5
FSOINet 19.09/0.451 9 22.66/0.702 3 26.49/0.856 1 32.11/0.949 1 25.09/0.739 9
MFCANet 21.07/0.592 9 25.18/0.820 1 30.02/0.933 7 38.32/0.987 4 28.65/0.833 5

在Set11测试集部分图像下各种重构算法的PSNR(dB)对比结果如表2所示,其中,在1%低采样率下,图像为“Boats”“Monarch”和“Parrots”时,所提算法的重构图像PSNR较ISTA-Net++分别提高了 1.41 dB、3.44 dB和3.42 dB.在10%较高采样率下,图像为“Barbara”“Fingerprint”和“Lena”时,所提算法的重构图像PSNR相较于FSOINet分别提高了7.53 dB、13.93 dB和4.62 dB.

表2  Set11测试集部分图像下各种重构算法的PSNR(dB)对比
Tab.2  PSNR(dB) comparison of various reconstruction algorithms under partial images in Set11 test set
采样率/%算法BarbaraBoatsHouseFingerprintMonarchLenaParrotsPeppers平均值
1 ReconNet 17.36 18.47 19.80 14.78 15.39 17.29 17.63 16.88 17.20
ISTA-Net+ 18.53 18.51 20.00 14.85 15.01 18.54 18.06 16.94 17.56
CSNet+ 20.05 20.40 22.76 16.77 17.72 21.23 22.15 19.45 20.07
OPINE-Net+ 20.98 21.14 22.10 16.75 17.63 21.34 22.02 19.62 20.20
ISTA-Net++ 20.78 22.70 25.71 15.54 19.65 22.60 21.15 21.16 21.16
MDCS-Net 20.02 20.45 23.31 16.75 17.32 21.10 22.24 19.17 20.05
FSOINet 22.32 22.44 25.40 17.18 18.80 23.42 22.78 21.19 21.69
MFCANet 22.35 24.11 27.61 17.54 23.09 24.94 24.57 22.58 23.35
10 ReconNet 21.89 24.15 25.69 20.75 21.11 23.83 22.63 22.15 22.78
ISTA-Net+ 23.52 27.41 30.49 22.55 25.72 27.50 26.37 27.13 26.34
CSNet+ 22.80 27.45 31.29 19.39 27.26 27.94 27.26 25.44 26.10
OPINE-Net+ 24.73 30.94 34.03 20.68 29.94 30.09 29.34 30.66 28.80
ISTA-Net++ 25.07 29.07 33.10 20.03 27.66 28.76 28.09 29.42 27.65
MDCS-Net 22.85 28.07 32.17 19.76 28.70 28.52 28.33 27.12 26.94
FSOINet 25.25 31.53 34.90 19.59 30.91 30.58 29.81 31.41 29.25
MFCANet 32.78 34.18 37.94 33.52 34.84 35.20 35.70 32.27 34.55

本文对比了在1%、4%、10%和25%采样率下重构图像的视觉效果,如图7~图10所示.为了进行细节纹理的对比,图像子区域用红色矩形框标记并进行了放大.从图7~图10的视觉示例中可看出,MFCANet在视觉效果和PSNR/SSIM数值上均优于其他重构算法.在1%和4%低采样下,从图7图8中看出,ISTA-Net+重构图像存在严重的块伪影问题,视觉效果较差,CSNet+、OPINE-Net+和MDCS-Net的重构图像较ISTA-Net+有了很大的提升,但在纹理结构及细节方面,其重构效果相较于所提算法表现较差.FSOINet重构的图像整体更加平滑和清晰,然而也缺失了部分复杂的纹理细节.从图9中可以看到,在较高采样率10%下,大部分重构图像整体都有很好的视觉效果,进一步从选取的局部来看,本文算法对复杂和细小的图像信息重构效果最好,纹理细节更加清晰可见.

fig

图7  在1%采样率下图像“House”的重构结果对比

Fig.7  Comparison of reconstruction results of image “House” at 1% sampling rate

fig

图8  在4%采样率下图像“Parrots”的重构结果对比

Fig.8  Comparison of reconstruction results of image “Parrots” at 4% sampling rate

fig

图9  在10%采样率下图像“ppt3”的重构结果对比

Fig.9  Comparison of reconstruction results of image “ppt3” at 10% sampling rate

fig

图10  在25%采样率下图像“BSDS68(test 02)”的重构结果对比

Fig.10  Comparison of reconstruction results of image “BSDS68(test 02)” at 25% sampling rate

3.4 MDRB模块数量及收敛情况

为了确定深度重构部分中MDRB模块的个数,在1%采样率下完成了如图11所示的实验.从图11中可观察到,MDRB的数量为6时,在验证集上的收敛最快且均方误差损失最小.若模块数量过少,无法提取到足够的特征;若模块数量过多,特征的表达能力下降,造成最终的重构图像质量下降.

fig

图11  不同数量的MDRB的对比

Fig.11  Comparison of different numbers of MDRBs

3.5 剪枝前后对比

为了使所提图像重构网络能够更加轻量化,本文将结构复杂的深度重构提取特征模块进行了滤波器剪枝,剪枝前后结果对比如表3所示.

表3  MDRB剪枝前后模型参数量和平均PSNR/SSIM/重构时间的对比
Tab.3  Comparison of model parameter quantity and average PSNR/SSIM/reconstruction time before and after MDRB pruning
采样率/%

MDRB

剪枝率/%

模型参数量平均 PSNR(dB) / SSIM / 重构时间(s)
Set11BSDS68
1 0 0.539 6 M 23.44/0.695 7/0.020 2 24.24/0.658 4/0.002 8
50 0.341 4 M(↓36.7%) 23.37/0.680 3/0.019 0 24.12/0.651 1/0.002 5
4 0 0.579 3 M 28.27/0.882 2/0.021 0 27.96/0.832 5/0.002 8
50 0.381 1 M(↓34.2% ) 28.21/0.881 4/0.019 2 27.93/0.832 3/0.002 5
10 0 0.657 4 M 34.26/0.963 0/0.020 8 32.61/0.938 3/0.003 0
50 0.459 2 M(↓30.1%) 34.30/0.964 0/0.019 0 32.67/0.938 8/0.002 7
56 0.435 1 M(↓33.8%) 34.04/0.960 9/0.019 0 32.47/0.936 3/0.002 7

表3可见,在1%和4%采样率下,MDRB的剪枝率达到50%时,模型参数量分别下降36.7%和34.2%.例如1%采样时,在Set11和BSDS68数据集上平均PSNR/SSIM分别降低了0.07 dB/0.015 4和0.12 dB/0.007 3,而平均重构时间分别减少了0.001 2 s和0.000 3 s,模型参数量减少,提升了重构速度.在10%采样率下,剪枝率为50%时,模型参数减少了30.1%,数据集Set11和BSDS68的平均PSNR提升了0.04 dB和0.06 dB,通过选择熵值高的特征图来保留重要的滤波器,使得高频特征更加集中,重构图像质量有所提高.当采样率为10%,剪枝率为56%时,模型参数量减少了33.8%,各数据集上平均重构时间分别减少0.001 8 s和0.000 3 s,平均PSNR/SSIM分别降低了0.22 dB/0.002 1和0.14 dB/0.002 0,更深度的剪枝能减少模型的参数量,但重构图像的质量也开始略微降低.

图12所示,本文在10%采样率下设置了两组实验,分别为:MDRB剪枝后每路的输出通道变为8和MDRB最初每路输出通道为8,来验证滤波器剪枝的可行性.分析图12可得,与初始设置MDRB每路的输出通道数为8相比,依据特征图的熵完成MDRB每路输出通道数剪枝50%可将PSNR分别提高 0.12 dB、0.09 dB和0.13 dB,证明信息熵高的特征图更能聚合图像的高频特征,可提高重构图像的质量.

fig

图12  通道数为8的结果对比

Fig.12  Comparison of results with 8 channels

3.6 消融实验

为了探究不同采样方式以及各个模块之间的相互影响,本文在1%采样率下进行了不同模块的消融实验,如表4所示.

表4  1%采样率下不同模块的消融实验
Tab.4  Ablation experiments of different modules at 1% sampling rate
分组单尺度多尺度多尺度融合CAMDM平均 PSNR(dB)/SSIM
Set11Set14BSDS68
(a) 20.04/0.552 4 20.69/0.536 5 21.46/0.534 9
(b) 23.37/0.683 1 23.94/0.670 3 24.13/0.654 1
(c) 23.44/0.695 7 24.09/0.678 1 24.24/0.658 4
(d) 23.12/0.6626 23.72/0.654 2 23.88/0.640 4
(e) 23.42/0.692 7 23.97/0.676 2 24.13/0.657 6
(f) 22.24/0.585 6 23.00/0.571 6 23.08/0.552 3

从(a)、(b)和(c)组分析可得,多尺度相较单尺度采样,最终的重构图像具有较高的PSNR和SSIM.在Set11上,(b)、(c)相比于(a),PSNR/SSIM分别提高了3.33 dB/0.130 7和3.40 dB/0.143 3.由此证明,多尺度融合采样能提取到更丰富的图像特征用于重构.由(c)、(d)可得,坐标注意力能定位更加准确和细节特征,使PSNR分别提高0.32 dB、0.37 dB和0.36 dB.多尺度去噪模块能有效去除初始重构图像中的噪声,从(c)、(e)可得,它使得最终重构图像PSNR分别提高0.02 dB、0.12 dB和0.11 dB.

图13所示,本文对比了两种采样方式下所得的初始重构图像,从整体的图像视觉效果和矩形框所标出的区域可验证多尺度融合采样的有效性,在得到更丰富的压缩感知测量值后能有效提高图像的重构质量以及细节信息的重构效果.如图14所示,在1%采样率下CA模块对重构效果的影响,从所选图像中可观察到,坐标注意力的引入不仅能使重构图像整体视觉效果有所提升,而且在矩形框所标注的细节纹理区域也有较好的表现.由此表明,坐标注意力能定位到纹理结构丰富的区域,为重构过程提供更多的图像信息.

fig

图13  采样方式对重构图像的影响

Fig.13  The impact of sampling methods on reconstructed images

fig

图14  CA对重构图像的影响

Fig.14  The impact of CA on reconstructed images

4 结 论

本文提出了一种基于滤波器剪枝的多尺度压缩感知图像重构网络,在提升图像重构质量的同时压缩网络模型.所提网络包括多尺度融合采样子网络、初始重构子网络和深度重构子网络三部分.采样网络利用多尺度空洞卷积对原始图像进行线性分解,然后融合相邻卷积层的特征,完成多尺度采样操作.初始重构采用反卷积将压缩感知测量值恢复到原始图像大小.深度重构中,在多尺度空洞残差块中引入坐标注意力,从水平和竖直两个方向用精确的位置信息对通道关系和长距离依赖进行编码,提取包含更多细节的图像特征.通过基于特征图熵准则剪枝多尺度空洞残差模块来压缩网络模型,使其参数量变少且重构速度加快.实验结果表明,在不同采样率下,本文提出的重构网络和其他重构算法相比,重构图像的质量提升较为明显,纹理细节也更加清晰,滤波器剪枝也使得网络模型更加轻量化.

参考文献

1

DONOHO D LCompressed sensing[J].IEEE Transactions on Information Theory2006524):1289-1306 [百度学术] 

2

王继良周四望金灿灿基于对抗样本的深度学习图像压缩感知方法[J].湖南大学学报(自然科学版)2022494):11-17 [百度学术] 

WANG J LZHOU S WJIN C C. Method of deep learning image compressed sensing based on adversarial samples[J]. Journal of Hunan University (Natural Sciences)2022494): 11-17(in Chinese) [百度学术] 

3

仲元红周宇杰张静基于非局部先验的深度压缩感知图像重构网络[J].电子与信息学报2023452):654-663 [百度学术] 

ZHONG Y HZHOU Y JZHANG Jet al. Deep compressive sensing image reconstruction network based on non-local prior[J]. Journal of Electronics & Information Technology2023452):654-663(in Chinese) [百度学术] 

4

陈文俊杨春玲图像压缩感知的特征域优化及自注意力增强神经网络重构算法[J].电子学报20225011):2629-2637 [百度学术] 

CHEN W JYANG C LFeature-space optimization-inspired and self-attention enhanced neural network reconstruction algorithm for image compressive sensing[J].Acta Electronica Sinica20225011): 2629-2637(in Chinese) [百度学术] 

5

YUAN XBRADY D JKATSAGGELOS A KSnapshot compressive imaging:theory,algorithms,and applications[J].IEEE Signal Processing Magazine2021382):65-88 [百度学术] 

6

ROGERS C APOPESCU D CCompressed sensing MIMO radar system for extended target detection[J].IEEE Systems Journal2021151):1381-1389 [百度学术] 

7

王丽王威刘勃妮高光谱图像的埃尔米特压缩感知重构算法[J].激光与光电子学进展20205714): 141032 [百度学术] 

WANG LWANG WLIU B NHermitian compressed sensing reconstruction algorithm for hyperspectral images[J]. Laser & Optoelectronics Progress20205714):141032(in Chinese) [百度学术] 

8

TROPP J AGILBERT A CSignal recovery from random measurements via orthogonal matching pursuit[J]. IEEE Transactions on Information Theory20075312):4655-4666 [百度学术] 

9

BLUMENSATH TDAVIES M EIterative hard thresholding for compressed sensing[J].Applied and Computational Harmonic Analysis2009273):265-274 [百度学术] 

10

FIGUEIREDO M A TNOWAK R DWRIGHT S JGradient projection for sparse reconstruction:application to compressed sensing and other inverse problems[J].IEEE Journal of Selected Topics in Signal Processing200714):586-597 [百度学术] 

11

MOUSAVI APATEL A BBARANIUK R GA deep learning approach to structured signal recovery[C]//2015 53rd Annual Allerton Conference on Communication,Control,and Computing (Allerton)Monticello,ILUSA.IEEE20151336-1343 [百度学术] 

12

练秋生富利鹏陈书贞基于多尺度残差网络的压缩感知重构算法[J].自动化学报20194511):2082-2091 [百度学术] 

LIAN Q SFU L PCHEN S Zet alA compressed sensing algorithm based on multi-scale residual reconstruction network[J]. Acta Automatica Sinica20194511):2082-2091(in Chinese) [百度学术] 

13

ZHOU S WHE YLIU Y Het alMulti-channel deep networks for block-based image compressive sensing[J]. IEEE Transactions on Multimedia2021232627-2640 [百度学术] 

14

KULKARNI KLOHIT STURAGA Pet alReconNet:non-iterative reconstruction of images from compressively sensed measurements[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)Las Vegas,NV,USA.IEEE2016449-458 [百度学术] 

15

SHI W ZJIANG FLIU S Het alImage compressed sensing using convolutional neural network[J].IEEE Transactions on Image Processing202029375-388. [百度学术] 

16

CUI W XLIU S HJIANG Fet alImage compressed sensing using non-local neural network[J]. IEEE Transactions on Multimedia202325816-830 [百度学术] 

17

ZHANG JGHANEM BISTA-net:interpretable optimization-inspired deep network for image compressive sensing[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern RecognitionSalt Lake City,UT,USA.IEEE20181828-1837 [百度学术] 

18

ZHANG JZHAO CGAO WOptimization-inspired compact deep compressive sensing[J].IEEE Journal of Selected Topics in Signal Processing2020144):765-774 [百度学术] 

19

CHEN W JYANG C LYANG XFSOINET:feature-space optimization-inspired network for image compressive sensing[C]//ICASSP 2022—2022 IEEE International Conference on AcousticsSpeech and Signal Processing (ICASSP).Singapore,Singapore.IEEE20222460-2464 [百度学术] 

20

WEI D YWANG Z WMulti-scale channel network based on filer pruning for image super-resolution[J].Optik2021236166641 [百度学术] 

21

DENIL MSHAKIBI BDINH Let alPredicting parameters in deep learning[C]//Proceedings of the 26th International Conference on Neural Information Processing Systems-Volume 2Lake TahoeNevada.ACM20132148-2156 [百度学术] 

22

YANG T JCHEN Y HSZE VDesigning energy-efficient convolutional neural networks using energy-aware pruning[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)Honolulu,HI,USA.IEEE20176071-6079 [百度学术] 

23

CANH T NDINH K QJEON BDecomposition-based multiscale compressed sensing[C]//2018 International Workshop on Advanced Image Technology (IWAIT). Chiang Mai,Thailand.IEEE20181-4 [百度学术] 

24

CANH T NJEON BMulti-scale deep compressive sensing network[C]//2018 IEEE Visual Communications and Image Processing (VCIP)TaichungTaiwan,China.IEEE20181-4 [百度学术] 

25

SHI W ZJIANG FZHANG S Pet alDeep networks for compressed image sensing[C]//2017 IEEE International Conference on Multimedia and Expo (ICME). Hong KongChina.IEEE2017877-882 [百度学术] 

26

SHI W ZJIANG FLIU S Het alMulti-scale deep networks for image compressed sensing[C]//2018 25th IEEE International Conference on Image Processing (ICIP). Athens, Greece. IEEE201846-50 [百度学术] 

27

WANG Z BQIN Y LZHENG Het alMultiscale deep network for compressive sensing image reconstruction[J].Journal of Electronic Imaging202231013025 [百度学术] 

28

TU YWANG M YWANG SA data-driven deep neural network pruning approach towards efficient digital signal modulation recognition[C]//2019 IEEE Globecom Workshops (GC Wkshps)WaikoloaHI,USA.IEEE20191-5 [百度学术] 

29

魏钰轩陈莹基于自适应层信息熵的卷积神经网络压缩[J].电子学报20225010):2398-2408 [百度学术] 

WEI Y XCHEN YConvolutional neural network compression based on adaptive layer entropy[J].Acta Electronica Sinica20225010):2398-2408(in Chinese) [百度学术] 

30

王彩玲王炯蒋国平基于双DDPG的全局自适应滤波器剪枝方法[J].南京邮电大学学报(自然科学版)2021415):59-66 [百度学术] 

WANG C LWANG JJIANG G PGlobal adaptive filter pruning based on dual DDPG[J].Journal of Nanjing University of Posts and Telecommunications (Natural Science Edition)2021415):59-66(in Chinese) [百度学术] 

31

林景栋吴欣怡柴毅卷积神经网络结构优化综述[J].自动化学报2020461) :24-37 [百度学术] 

LIN J DWU X YCHAI Yet alStructure optimization of convolutional neural networks:a survey[J].Acta Automatica Sinica2020461):24-37(in Chinese) [百度学术] 

32

LI HKADAV ADURDANOVIC Iet al. Pruning filters for efficient convNets [C]// Proceedings of the 5th International Conference on Learning Representations (ICLR). Toulon, France2017128-140. [百度学术] 

33

HE YDONG X YKANG G Let alAsymptotic soft filter pruning for deep convolutional neural networks[J]. IEEE Transactions on Cybernetics2020508):3594-3604 [百度学术] 

34

WANG J LJIANG TCUI Z Yet alFilter pruning with a feature map entropy importance criterion for convolution neural networks compressing[J]. Neurocomputing2021461C):41-54 [百度学术] 

35

CANH T NDINH K QJEON BDecomposition-based multiscale compressed sensing[C]//2018 International Workshop on Advanced Image Technology (IWAIT). Chiang Mai,Thailand.IEEE20181-4 [百度学术] 

36

HUAN HLI P CZOU Net alEnd-to-end super-resolution for remote-sensing images using an improved multi-scale residual network[J].Remote Sensing2021134):666 [百度学术] 

37

GAO CZHOU R GLI XQuantum color image scaling based on bilinear interpolation[J].Chinese Physics B2023325):050303 [百度学术] 

38

WANG Z FWANG Z HZENG C Yet alHigh-quality image compressed sensing and reconstruction with multi-scale dilated convolutional neural network[J].Circuits,Systems,and Signal Processing, 2023423): 1593-1616 [百度学术] 

39

HOU Q BZHOU D QFENG J SCoordinate attention for efficient mobile network design[C]//2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)Nashville,TNUSA.IEEE202113708-13717 [百度学术] 

40

SRINIVASAN N. A computational perspective on visual attention [J]. Current Science201310411): 1560-1561. [百度学术] 

41

吴立帅深度神经网络中的结构化模型压缩算法研究与应用[D].成都电子科技大学2020 [百度学术] 

WU L SResearch and Application of Structured Model Compression Algorithm in Deep Neural Network[D]. ChengduUniversity of Electronic Science and Technology of China2020(in Chinese) [百度学术] 

42

AGUSTSSON ETIMOFTE RNTIRE 2017 challenge on single image super-resolution:dataset and study[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). Honolulu,HI,USA.IEEE20171122-1131 [百度学术] 

43

YOU DXIE J FZHANG JISTA-NET:flexible deep unfolding network for compressive sensing[C]//2021 IEEE International Conference on Multimedia and Expo (ICME)ShenzhenChina.IEEE20211-6 [百度学术] 

作者稿件一经被我刊录用,如无特别声明,即视作同意授予我刊论文整体的全部复制传播的权利,包括但不限于复制权、发行权、信息网络传播权、广播权、表演权、翻译权、汇编权、改编权等著作使用权转让给我刊,我刊有权根据工作需要,允许合作的数据库、新媒体平台及其他数字平台进行数字传播和国际传播等。特此声明。
关闭